/사진=게티이미지뱅크
올해 초 한 방송사에서 마이크로소프트의 생성형 인공지능(AI) 빙(Bing)에게 "1997년 월드컵에서 우승한 한국에 대해서 자세하게 설명해줘"라고 묻자 돌아온 답변이다. 실제 대회에서 우승국은 우루과이를 2대 1로 누른 아르헨티나가 차지했다. 그럼에도 빙은 최우수선수(MVP)를 차지했다는 선수 실명까지 거론하며 사실인 것처럼 답변을 이어갔다.
AI가 태연히 거짓말을 하는 현상을 개발자들은 '환영'(Hallucination)이라고 부른다. 앞선 사례들은 코웃음 칠 만한 수준이지만, 환영은 그냥 넘길 문제가 아니다. 특히 AI 활용이 늘어나고 있는 의료, 법률 분야에서 전문가가 환영에 속아 넘어가 의사결정을 한다면 돌이킬 수 없는 결과를 초래할 수 있다.
아서AI는 이 문제를 해결하기 위한 최초의 LLM 방화벽 '아서 실드'를 개발한 업체다. 창업자 웬첼은 머신러닝 기반 사이버보안 스타트업 아낙스시큐리티를 창업, 미국 금융사 캐피털원에 매각한 뒤 캐피털원 부사장으로 취임했다. 이곳에서 신용도 결정, 금융사기 예방 등을 위한 AI 시스템을 개발하면서 머신러닝을 어떻게 감독할 것인지를 고민했다.
/사진=아서ai 홈페이지
이 시각 인기 뉴스
아서 실드는 LLM 입·출력 데이터를 걸러내는 필터 역할을 한다. 악의를 가진 사용자가 알고리즘을 오염시킬 목적으로 LLM에 데이터를 주입하지 못하도록 차단한다. LLM에서 출력된 데이터에 민감한 개인정보가 포함되지 않았는지, 거짓 사실이나 악의적 메시지를 포함하지 않았는지 등을 분석하기도 한다.
AI 편견을 바로잡는 것도 아서AI의 중요 과제 중 하나다. 금융회사 AI가 고객의 신용도를 평가할 때 인종, 학력 등에 기반한 편견에 사로잡히기 쉽다. 조건이 같아도 대학을 졸업한 백인 남성보다 유색, 소수 인종 여성의 신용도를 더 낮게 평가할 수 있다는 뜻이다. 이를 해결하려면 기존 AI 알고리즘을 전부 뜯어고쳐야 하는 것으로 여겨졌다. 아서AI의 편향성 보정 코드를 추가하면 기존 알고리즘에 손대지 않고 최소 비용과 오차로 AI 편견을 바로잡을 수 있다고 한다.
아서AI는 지난 2022년 9월까지 두 번의 투자모금에서 6000만 달러(800억원)을 모금헀다. 디스코드, 엘라스틱 등 90곳 이상 유니콘 기업 투자 포르폴리오를 가진 투자자 인덱스 벤처스, 구글·인텔과 투자 파트너십을 맺고 있는 플렉소 캐피털 등이 아서AI 투자에 참여했다. 고객사로는 미국 국방부와 미국 대형 의료보험사 휴마나 등이 있다.
웬치는 "LLM는 인터넷 출현 이후 등장한 가장 파괴적인 기술 중 하나로 대중과 기업를 해칠 수 있는 수많은 잠재적 위험을 품고 있다"며 "(AI에서) 불필요한 리스크를 제거하고 더욱 안전하고 신속하게 기술을 배포할 수 있는 도구를 개발할 것"이라고 했다.
[머니투데이 스타트업 미디어 플랫폼 '유니콘팩토리']