국내 기업 중 가장 먼저 한국어 초거대 AI를 개발한 네이버는 오는 25일 '네이버 AI 나우' 행사에서 연구성과와 계획을 발표한다. 지난해 수백억원을 들여 국내 최초로 도입한 700 페타플롭(1페타플롭은 1초당 1000조회의 연산 처리가 가능한 수준) 이상의 슈퍼컴퓨터 인프라와 한국어 초거대 AI가 적용된 서비스를 소개한다.
주목되는 부분은 AI의 파라미터(매개변수) 규모다. 현존하는 초거대 AI 중 최고로 평가받는 미국 오픈AI의 'GPT-3'는 1750억개 파라미터를 보유했다. 파라미터 규모가 클수록 AI 지능도 높아지는 만큼, 네이버의 초거대 AI가 GPT-3 대비 어느 정도의 성능을 갖췄는지 확인할 수 있을 전망이다.
━
네이버 초거대 AI 상용화 시작…LG "GPT-3 뛰어넘겠다"━
강인호 네이버 NLP조직 책임리더는 "초거대 AI를 대규모 이용자 서비스에 상용화하려면 모델을 최적화하고 데이터 처리 속도를 개선하는 등 고도의 기술력이 뒷받침돼야 한다"고 강조했다. 네이버가 중장기 AI 기술 연구조직인 '네이버 AI 랩'을 신설하고, 최근 서울대 및 카이스트와 초거대 AI 연구센터를 설립하는 등 수백억원대 투자를 예고한 배경이다.
LG AI 연구원의 목표는 GPT-3를 뛰어넘는 초거대 AI다. 3년간 1억 달러(약 1130억원)를 투자해 올 하반기 GPT-3의 3.4배 수준인 6000억개 파라미터를 갖춘 초거대 AI를 선보인다. 내년 상반기엔 이를 조 단위로 확대할 계획이다. 언어뿐 아니라 영상과 이미지를 이해하고 데이터를 추론하는 상위 1% 인간 전문가 수준의 AI를 선보이겠다는 포부다.
SK텔레콤 역시 GPT-3와 유사한 수준의 초거대 AI를 준비 중이다. 연내 1500억개의 파라미터를 가진 초거대 AI 'GLM'을 개발한다는 방침이다. 이를 위해 SK텔레콤은 카카오와 AI 동맹을 맺고 인프라·데이터·언어모델 등 전방위로 협력하기로 했다. 또 국립국어원의 언어 정보를 활용해 AI의 정확도와 활용도를 높일 예정이다.
카카오도 카카오브레인·엔터프라이즈와 자체적으로 초거대 AI를 구축하는 방안을 검토하고 있다. KT는 연내 카이스트와 'AI·SW 기술 연구소'를 설립해 초거대 AI를 공동 개발하기로 했다. 대전 KT대덕2연구센터에 최첨단 인프라와 전문 연구인력, 양 기관의 데이터를 모아 초거대 AI R&D에 박차를 가한다는 계획이다.
━
"美中 기술 패권 속 韓 AI 주권 확보해야"━
또 GPT-3를 비롯해 해외 초거대 AI 대부분이 영어 기반인 만큼, 한국어에 특화된 초거대 AI가 필요하다는 지적도 있다. 미국과 중국이 주도하는 AI 기술 경쟁에 종속되지 않으려면 한국어 기반의 AI 생태계를 만들어야 한다는 설명이다.
업계 관계자는 "GPT-3는 학습 데이터의 90% 이상이 영어이다 보니 영어와 한국어 간 성능 차이가 있다"며 "초거대 AI를 직접 개발하는 것보다 해외 모델을 적용하는 게 더 쉽지만, 국내 시장에 최적화된 서비스를 내놓긴 어려울 것"이라고 말했다. 이어 "AI 주권을 확보하는 차원에서 한국어 초거대 AI 개발은 의미가 크다"고 강조했다.
<저작권자 © ‘돈이 보이는 리얼타임 뉴스’ 머니투데이. 무단전재 및 재배포, AI학습 이용 금지>