"중국어는 챗GPT보다 낫다"… 1000만자 입력하는 중국 AI 챗봇

머니투데이 김재현 전문위원 2024.03.26 16:33
글자크기

문샷AI·알리바바·바이두 등 입력분량 경쟁적 확대
오픈AI의 GPT-4 터보는 중국어로 10만자 서비스
"입력 분량은 AI 모델의 단면일 뿐… 여전히 차이"

/로이터=뉴스1/로이터=뉴스1


중국 인공지능(AI) 챗봇들이 텍스트의 입력 분량을 경쟁적으로 늘리고 있다. 입력 분량 면에선 이미 오픈AI의 챗GPT를 뛰어넘었고 중국어 텍스트 이해에 관한 한 중국 AI 챗봇이 더 뛰어나다는 해석까지 나온다.

26일 중국증권보는 중국 AI 스타트업 문샷AI가 AI 챗봇 '키미(Kimi)'의 단일 프롬프트 입력 분량을 중국어 200만자로 확대하자, 알리바바·바이두 등 대형 인터넷 기업들도 앞다퉈 입력 분량을 늘리고 있다고 전했다.



문샷AI가 불지핀 텍스트 입력 분량 경쟁
양즈린 문샷AI 설립자/사진=중국 웨이보양즈린 문샷AI 설립자/사진=중국 웨이보
문샷 AI는 설립 10개월 만에 25억달러의 기업가치를 인정받은 중국 AI 산업계의 스타다. 설립자 양즈린(33)은 중국 선두 AI 스타트업 창업자 중에서 가장 젊다. 칭화대 컴퓨터학과를 졸업한 후 자연어처리 분야 세계 1위인 미국 카네기멜론대 언어기술연구소(LTI)에서 박사학위를 받았다. 지도교수는 애플의 AI리서치 디렉터를 역임한 러슬란 살라쿠트디노프와 구글 수석과학자 윌리엄 코헨이다.

문샷AI가 지난 10월 발표한 키미는 단일 프롬프트의 입력 분량이 중국어 20만자였는데, 지난 18일 입력 분량을 200만자로 확대하기 위한 내부 테스트가 진행 중이다. 곧이어 알리바바, 바이두 등 중국의 인터넷 공룡들도 AI 챗봇 업그레이드를 선언하며 경쟁이 격화됐다.



지난 22일 알리바바의 AI 챗봇 '통이치엔원'은 최대 1000만자 입력이 가능한 텍스트 처리 서비스를 무료로 제공한다고 밝혔다. 바이두의 '어니봇(Ernie Bot)'도 다음달 업그레이드를 통해, 텍스트 입력 분량을 200만~500만자로 확대할 예정이라고 공개했다. 어니봇은 중국 1위 AI 챗봇으로 올해 애플이 중국에서 출시할 아이폰16에 탑재될 예정이다.

AI분야 엔젤투자자인 궈타오는 "대형 AI모델의 텍스트 입력 분량 확대는 시장 수요를 직접적으로 반영한 것"이라고 말했다. 그는 "학술 논문, 법률 문서, 신문 기사 등 장문의 텍스트 처리에 대한 수요가 계속 증가하고 있으며 장문 처리 능력이 향상되면 문헌 이해와 보고서 작성 등 복잡한 언어 커뮤니케이션을 시뮬레이션할 수 있는 능력이 향상될 것"이라고 덧붙였다.

키미의 200만자, 치엔이통원의 1000만자 등 중국 초거대 AI 모델이 단일 프롬프트 입력분량을 확대하면서 중국의 AI가 입력 분량 면에선 오픈AI를 넘어섰다. 오픈AI의 GPT-4 터보(Turbo) 모델은 단일 프롬프트에서 300페이지 분량의 텍스트를 이해하고 처리할 수 있는데, 중국증권보는 이는 중국어 10만자에 해당한다고 전했다. 한 중국 사용자는 "텍스트 처리의 안정성 면에서는 키미가 챗GPT보다 뛰어나다"며 "장문의 텍스트를 분석할 때 챗GPT를 사용하면 오류가 발생하기 쉬운데 키미는 오류가 적다"고 덧붙였다.


중국 최초의 인간+AI가 쓴 장편소설
‘천운의 사도’ 도입부/사진=중국 펑파이신문 캡처‘천운의 사도’ 도입부/사진=중국 펑파이신문 캡처
텍스트 처리 기능 확장이 가져온 변화도 현재 진행형이다. 이번 달 중국 화동사범대학의 왕펑 교수팀은 중국 최초로 인간과 AI가 함께 쓴 장편소설 '천운의 사도'를 발표했다. 이 소설은 중국 대형 AI모델을 이용해, 프롬프트로 내용을 작성한 후 연구팀이 윤색하는 방식으로 작성했으며 전체 분량은 100만자(약 1500페이지)에 달한다.

왕 교수는 개인의 창의력과 AI모델의 작문 능력을 결합할 수 있는 장편소설 창작 플랫폼을 만들어서 누구나 장편소설을 쓰게 만들겠다고 밝혔다. 왕 교수팀의 다음 목표는 100만자 분량의 장편소설을 집필하는 데 걸리는 시간을 기존 6주에서 2~3주로 단축하는 것이다.

한편, 중국 AI업계 관계자들은 텍스트 입력분량이 AI모델의 학습 능력을 판단하는 유일한 기준은 아니며 대형언어모델(LLM)의 능력을 드러내는 한 방면일 뿐이라고 짚었다. 엔젤투자자 궈타오는 모델의 학습능력에는 다양한 유형의 데이터를 처리하는 능력, 안정성, 확장성 등 다양한 기준이 포함된다고 말했다. 자오강 싸이즈산업연구원 원장도 "멀티모달리티(생성형 AI가 이미지, 영상, 음성, 제스처 등을 인식해 인간처럼 자연스러운 소통을 하는 것), 매개변수 규모, 범용성 측면에서 중국은 오픈AI 등 해외 AI 기업과 적잖은 차이가 있다"고 말했다.
TOP