2020년 미국의 인공지능 연구소 오픈AI가 인공지능(AI) 모델 'GPT-3'를 선보이면서 '초거대 AI' 시대가 열렸다. 1750억개 파라미터(매개변수)를 적용한 GPT-3의 등장으로 AI가 인간처럼 자연스러운 대화를 생성할 수 있게 됐다. '매개변수'는 어떤 입력값을 넣었을 때 원하는 결과를 얻기 위해 AI가 찾아야 하는 변수를 뜻하는데, 이 매개변수의 규모가 AI 모델의 크기를 나타낸다. 사람의 뇌에서 뉴런을 연결해 정보를 학습하고, 기억하는 역할을 담당하는 시냅스와 유사하다. 인간은 평균 100조개의 시냅스를 갖고 있다.
지난해까지 많은 AI 기업이 매개변수를 늘리고 AI 모델 크기를 키우는데 집중했다. AI 모델이 가진 매개변수의 수가 인간 시냅스를 넘어설 때, 비로소 인간의 뇌처럼 복잡하고 많은 문제를 해결할 수 있다고 믿었기 때문이다. 그러나 최근 이를 뒤집는 연구결과가 나오며 '초거대 AI' 분야는 전환점을 맞았다. 완성도를 높이기위한 '매개변수'보다 빅데이터로 '학습량'을 늘리는 게 AI 성능 향상에 더 도움될 수 있다는 것이다.
━
"거거익선? NO!" 실용구간 내라면 상용화가 먼저━
국내에서도 지난해까지 초거대 AI 분야에서 파라미터 개수를 확대하는 '모델 크기' 경쟁이 벌어졌다. SK텔레콤이 지난해 4월부터 1500억 파라미터를 목표로 GLM(한국어 범용 언어 모델) 개발에 착수했고, 같은 해 5월 네이버(NAVER)가 오픈AI의 GPT-3를 뛰어넘는 2040억개 매개변수 규모의 하이퍼클로바를 선보였다. LG AI 연구원도 하반기 중으로 6000억개 파라미터를 갖춘 초거대 AI를 내놓겠다고 선언하기도 했다. 그러나 최근에는 초거대 AI의 실서비스 적용을 통한 데이터 학습에 더 무게를 두는 분위기다. 김일두 카카오브레인 대표는 지난해 말 카카오의 '초거대 AI 로드맵'을 공개하며 실용성 있는 언어 모델 크기는 60~800억 파라미터라고 밝혔다.
━
네카오부터 이통3사까지…초거대 AI 상용화 박차 ━
네이버는 지난해부터 쇼핑·검색·챗봇·AI스피커 등 네이버 서비스 전반에 초거대 AI를 적용해왔다. 특히 '클로바 스튜디오'를 통해 스타트업도 '하이퍼클로바'를 활용할 수 있도록 했다. 현재 100여 개 스타트업이 클로바 스튜디오를 사용하고 있다.
카카오는 지난해 11월 GPT-3의 한국어 특화 AI 언어모델인 'KoGPT'를 올들어 실제 서비스에 적용하고 있다. 시 쓰는 AI 모델 '시아'가 대표적이다. 카카오브레인은 지난 8일 시아가 쓴 53편의 시를 담은 시집을 출간하기도 했다. 김일두 대표가 제시한 상용화 최소 규모인 '60억개' 파라미터로 상용화에 성공한 것이다.
이통3사도 본격적으로 초거대 AI 상용화 경쟁에 뛰어들었다. SK텔레콤은 GPT-3를 기반으로 한국어 특화 모델을 자체 개발하고, 지난 5월 이를 활용한 성장형 AI 서비스 '에이닷(A.)'을 공개했다. 에이닷은 자연어 처리(NLP) 기술과 감정 분석 기술 등을 적용해 일상적 대화나 특정 모바일 작업을 처리해준다.
KT는 연내 상용화를 목표로 초거대 AI를 개발 중이다. 카이스트나 한국전자통신연구원(ETRI) 등이 속한 'AI 원팀'이 초거대 AI 언어모델을 개발하고 있으며, 초거대 AI 완성 즉시 상용화할 수 있도록 준비 중이다. KT는 먼저 초거대 AI를 AI 스피커 기가지니와 AICC(인공지능 컨택센터) 서비스 고도화에 활용할 계획이다.
LG유플러스는 LG그룹 차원에서 개발한 초거대 AI 모델 '엑사원'을 활용해 자사 AI 서비스를 고도화할 전망이다. 현재 LG유플러스가 엑사원으로 준비 중인 서비스는 IPTV에 적용할 'AI 콘텐츠 큐레이터' 서비스다. AI 콘텐츠 큐레이터는 개인별 시청 성향을 기반으로 검색 또는 소개 화면에서 콘텐츠 소개 문구나 문장을 자동완성 해 준다.
[저작권자 @머니투데이, 무단전재 및 재배포 금지]