"한글 만든 中" "조선의 왕 신사임당"…챗GPT 엉터리 답, 어디서 나왔지?

머니투데이 윤지혜 기자, 배한님 기자 2023.02.14 05:37
글자크기

[MT리포트-생성 AI 시대, 한국은 어디로] 1-⑦

편집자주 사람처럼 대화하는 '생성AI 신드롬'이 거세다. 챗GPT 쇼크로 빅테크의 AI 개발경쟁이 불붙은 것은 물론, 우리 일상과 사회 각 분야로 AI가 빠르게 스며들고 있다. 이는 기존 관행과 질서에 상당한 변화와 충격을 몰고 왔다. 도구로서 효용성이 큰 반면, 대필과 표절 등 악용사례도 잇따른다. 생성AI 시대를 마주한 한국의 현주소와 논란, 그리고 대처법을 짚어본다.

/사진=챗GPT 캡처/사진=챗GPT 캡처


"훈민정음은 15세기 중국의 이황이 만든 한글의 원리를 설명하는 서적입니다."

AI 챗봇 '챗GPT'에 '훈민정음에 대해 알려줘'라고 질문하니 황당한 대답이 돌아왔다. 훈민정음이 15세기인 1443년에 창제된 건 맞지만, 이를 만든 건 중국의 이황이 아니라 세종대왕이다. 우리에게 익숙한 퇴계 이황은 중국인도 아닐뿐더러 훈민정음 창제 후인 1501년에 태어났다. 또 다른 질문에선 챗GPT가 '훈민정음은 중국 고대 어휘'라고 설명한 것으로 나타났다.

/사진=독자제공/사진=독자제공
이는 비단 챗GPT만의 문제는 아니다. 구글이 최근 선보인 AI 챗봇 '바드'도 '제임스 웹 우주망원경이 태양계 박 행성을 처음 찍었다'고 잘못 말해 망신을 당했다. 미 항공우주국(NASA)에 따르면 태양계 밖 행성을 처음 촬영한 건 2004년 유럽남방천문대의 초거대 망원경(VLT)이다. 검색왕좌의 치명적인 실수에 구글의 모회사 알파벳 주가는 8% 가까이 떨어지기도 했다.



생성 AI의 고질병인 '할루시네이션'(hallucination·환각)의 대표 사례다. AI가 오류가 있는 데이터를 학습해 잘못된 정보를 사실인 양 알려주는 것이다. 사실과 오류가 교묘히 섞여 쉽게 오답을 알아차리기도 쉽지 않다. 문제는 생성 AI가 교육·의료·금융·쇼핑·미디어 등 전 분야에서 활용되면서 각종 편견과 가짜뉴스를 담은 잘못된 정보가 확대 재생산될 수 있다는 점이다.

특히 데이터가 부족한 한국어 서비스에선 이런 오류가 더 빈번히 나타날 수 있다. 실제 챗GPT에 신사임당에 관해 묻자, '조선의 23번째 왕'이라거나, '남편이 이순신 장군'이라고 답하는 등 오답을 쏟아냈다. 또 신사임당의 아들이 율곡 이이가 아닌 퇴계 이황이라고 답하기도 했다. 반면 영어로 같은 질문을 했을 땐 정답을 말했다.



샘 알트먼 오픈AI CEO(최고경영책임자)는 "중요한 일을 챗GPT에 의존하는 것은 실수"라며 "우리는 견고성과 진실성에 대해 할 일이 많이 남았다"라고 경고한 건 유명한 일화다. 프라바카르 라그하반 구글 수석부사장도 바드의 할루시네이션 가능성을 인정하며 바드를 빠르게 상용화하지 않는 이유로 "분명히 긴급함을 느껴지면 큰 책임감도 느낀다"라며 "대중을 오도하고 싶지 않다"고 설명했다.

/사진=온라인커뮤니티 캡처/사진=온라인커뮤니티 캡처
이 답변, 어디서 참고했니?…"출처공개로 투명성 높여야"
전문가들은 이런 오류를 줄이기 위해 챗GPT가 △외부 소스에서 정보를 검색할 수 있도록 하고 △정보의 참고·인용 출처를 공개하는 방안을 대안으로 제시한다. 챗GPT는 2021년까지의 데이터만 학습해 최신 정보가 부족한데, 외부 소스에도 접근할 수 있다면 'A기업 주가' 등 최신 정보를 묻는 말에도 정확한 답변을 내놓을 수 있을 것이란 진단이다.

챗GPT가 참조·인용한 출처를 밝혀 투명성을 높이는 방안도 있다. 실제 네이버는 올 상반기 챗GPT와 같은 '서치GPT'를 선보이면서 최신 데이터를 출처와 제공키로 했다. 예컨대 챗GPT에 '서울 지하철 요금이 얼마야?'라고 문의하면 '카드(환승) 1450원, 카드(일반) 1750원, 현금(일반) 2000원'(현재 카드 1250원, 현금 1350원)이라는 엉터리 대답을 내놓는다. 어떻게 이런 답변이 나오게 됐는지도 불분명하다.


반면 네이버는 지하철 요금을 행정안전부 등 출처 및 기준일과 함께 공개할 전망이다. 최수연 네이버 대표는 "서치GPT를 네이버 검색 결과에 직접 적용시키는 보다는 기존 생성형 AI 단점을 해결하는 방법을 실험할 것"이라며 "이용자의 만족도나 데이터가 충분히 쌓이면 특히 정보성 검색에 대해서는 포털 검색 결과에 넣는 방안을 검토할 예정"이라고 말했다.
TOP