
카카오브레인의 AI 작가 칼로가 그린 호랑이 그림 '네오 브레인 타이거'에대한 설명이다. 25일 관련업계에 따르면 칼로의 호랑이 그림 28종 중 1개가 NFT(대체불가토큰) 거래 플랫폼 '클립드롭스'에서 700클레이튼(KLAY)에 판매됐다. 당시 시세로 약 24만원 수준이다. 지난 5~6월 클립드롭스에서 민팅 당시 100클레이였던 점을 고려하면 두 달만에 가치가 7배로 뛴 셈이다.
지난 7월 칼로와 협업한 작품을 선보인 고상우 작가는 "'파란 호랑이'·'빨간 호랑이' 등의 실행어를 주면 어느 AI나 (그림을) 만들어낼 수 있지만, '부자 호랑이'·'가난한 호랑이' 등 추상적인 문구를 입력해도 칼로는 그 언어를 이해하는 능력을 보여줬다"라며 "AI는 인간을 돕는 보조자 역할로 생각하기 쉬운데 스스로 창작할 수 있는 능력까지 갖췄다"고 말했다.

이 밖에도 CJ올리브네트웍스의 AI '에어트가' 류재춘 화백의 수묵산수화 '월하'(月河)를 채색한 '월화2021′는 지난 연말 업비트 NFT에서 개당 0.014비트코인(당시 시세로 약 100만원)에 완판됐다. LG의 AI 작가 '틸다'는 뉴욕 패션위크에서 박윤희 디자이너와 '금성에서 핀 꽃'을 주제로 패션쇼를 열었다. 200여개 의상은 틸다가 만든 이미지 3000여장 기반으로 제작됐다.
◆렘브란트 뛰어넘을까…'포르노 생성기'는 우려

실제 오픈AI의 달리2(DALL-E 2)는 '털실로 짠 괴물처럼 보이는 수프 그릇', '말을 타고 있는 우주비행사' 등 난해한 명령어도 작품으로 만들어낸다. 달리2는 지난해 공개된 달리1보다 4배 큰 해상도에 사실적이고 정교한 그림을 생성한다. 사진 속 고양이를 강아지로 바꾸거나, 질감·반사·그림자도 자연스럽게 수정한다. 오픈AI는 "이미지와 이미지를 설명하는 텍스트 간 관계를 학습한 덕분"이라고 설명했다.
한편에선 AI가 선정적, 폭력적인 그림을 그릴 수 있다고 우려한다. 실제 미국 최대 온라인 커뮤니티 레딧에 따르면 스태빌리티.AI의 '스테이블 디퓨전' 베타 테스트에서 여성 나체 등 고화질의 선정적 이미지를 생성할 수 있어 논란이 됐다. '타노스가 된 일론머스크', '인어공주가 된 엠마 왓슨'처럼 실존 인물 딥페이크로도 활용되는 것으로 나타났다.
이에 한 이용자는 "AI가 만드는 포르노가 코앞에 있다"며 "오디오·비디오 합성모델도 계획하고 있고, 이건 하나의 오픈소스 조직일 뿐이므로 상황은 점점 더 미쳐갈 것(keep getting crazier)"이라고 꼬집었다.
네카오부터 이통사·LG까지 빅테크들 '초거대 AI' 상용화 속도전② 파라메타 확대보다는 실적용해 학습량 늘리는 추세

지난해까지 많은 AI 기업이 매개변수를 늘리고 AI 모델 크기를 키우는데 집중했다. AI 모델이 가진 매개변수의 수가 인간 시냅스를 넘어설 때, 비로소 인간의 뇌처럼 복잡하고 많은 문제를 해결할 수 있다고 믿었기 때문이다. 그러나 최근 이를 뒤집는 연구결과가 나오며 '초거대 AI' 분야는 전환점을 맞았다. 완성도를 높이기위한 '매개변수'보다 빅데이터로 '학습량'을 늘리는 게 AI 성능 향상에 더 도움될 수 있다는 것이다.
◆"거거익선? NO!" 실용구간 내라면 상용화가 먼저
구글 딥마인드가 지난 4월 발표한 연구에서도 700억개의 매개변수를 가진 자사의 초거대 AI 모델 '친칠라'가 2800억개의 매개변수를 가진 기존 모델 '고퍼'보다 우수했다. 친칠라는 오픈AI의 GPT-3도 능가했다.
국내에서도 지난해까지 초거대 AI 분야에서 파라미터 개수를 확대하는 '모델 크기' 경쟁이 벌어졌다. SK텔레콤 (49,450원 ▲400 +0.82%)이 지난해 4월부터 1500억 파라미터를 목표로 GLM(한국어 범용 언어 모델) 개발에 착수했고, 같은 해 5월 네이버(NAVER (204,500원 0.00%))가 오픈AI의 GPT-3를 뛰어넘는 2040억개 매개변수 규모의 하이퍼클로바를 선보였다. LG AI 연구원도 하반기 중으로 6000억개 파라미터를 갖춘 초거대 AI를 내놓겠다고 선언하기도 했다. 그러나 최근에는 초거대 AI의 실서비스 적용을 통한 데이터 학습에 더 무게를 두는 분위기다. 김일두 카카오브레인 대표는 지난해 말 카카오의 '초거대 AI 로드맵'을 공개하며 실용성 있는 언어 모델 크기는 60~800억 파라미터라고 밝혔다.
◆네카오부터 이통3사까지…초거대 AI 상용화 박차

카카오는 지난해 11월 GPT-3의 한국어 특화 AI 언어모델인 'KoGPT'를 올들어 실제 서비스에 적용하고 있다. 시 쓰는 AI 모델 '시아'가 대표적이다. 카카오브레인은 지난 8일 시아가 쓴 53편의 시를 담은 시집을 출간하기도 했다. 김일두 대표가 제시한 상용화 최소 규모인 '60억개' 파라미터로 상용화에 성공한 것이다.
이통3사도 본격적으로 초거대 AI 상용화 경쟁에 뛰어들었다. SK텔레콤은 GPT-3를 기반으로 한국어 특화 모델을 자체 개발하고, 지난 5월 이를 활용한 성장형 AI 서비스 '에이닷(A.)'을 공개했다. 에이닷은 자연어 처리(NLP) 기술과 감정 분석 기술 등을 적용해 일상적 대화나 특정 모바일 작업을 처리해준다.
KT (30,850원 ▲250 +0.82%)는 연내 상용화를 목표로 초거대 AI를 개발 중이다. 카이스트나 한국전자통신연구원(ETRI) 등이 속한 'AI 원팀'이 초거대 AI 언어모델을 개발하고 있으며, 초거대 AI 완성 즉시 상용화할 수 있도록 준비 중이다. KT는 먼저 초거대 AI를 AI 스피커 기가지니와 AICC(인공지능 컨택센터) 서비스 고도화에 활용할 계획이다.
LG유플러스 (11,170원 ▲90 +0.81%)는 LG그룹 차원에서 개발한 초거대 AI 모델 '엑사원'을 활용해 자사 AI 서비스를 고도화할 전망이다. 현재 LG유플러스가 엑사원으로 준비 중인 서비스는 IPTV에 적용할 'AI 콘텐츠 큐레이터' 서비스다. AI 콘텐츠 큐레이터는 개인별 시청 성향을 기반으로 검색 또는 소개 화면에서 콘텐츠 소개 문구나 문장을 자동완성 해 준다.
문장 넘어 그림·영상·표정까지 읽는다...AI, 점점 더 사람처럼 진화③ 언어넘어 음성, 이미지, 표정까지 이해하는 AI로 진화

멀티모달 AI는 다양한 모달리티(Modality, 의사소통의 채널)를 동시에 받아들이고 사고하는 AI 모델을 의미한다. 기존 초거대 AI가 주로 언어에 초점을 둔 언어 모델이었다면 멀티모달 AI는 텍스트(문자) 데이터 외에도 이미지, 음성, 제스쳐, 시선, 표정, 생체신호 등 여러 입력방식(모달리티)을 받아들이고 사고할 수 있다. 인간과 AI가 더 자연스레 소통할 수 있다는 얘기다.
앞서 오픈AI는 초거대 AI 인 GPT-3에 이어 지난해 거대 멀티모달 AI인 달리(DALL-E)를 공개했다. GPT-3가 방대한 언어데이터를 학습해 활용한다면 달리는 텍스트와 더불어 이미지를 학습해 새로운 결과물을 만들어낸다. 올해 4월 등장한 달리2는 기존보다 이미지가 정교해지고 속도도 빨라졌다. 복잡한 배경과 그림자, 음영 까지 묘사한 사실적인 이미지에 수정사항도 지시할 수 있다.
국내에서도 카카오브레인이 기존의 민달리(minDALL-E)와 RQ트랜스포머(RQ-Transformer)를 융합해 하나의 페르소나인 '칼로'(Karlo)를 만들어냈다. 이것들은 모두 텍스트 명령어에 매칭되는 이미지를 만들어주는 멀티모달형 시스템이다.
LG AI연구원의 엑사원 역시 한국어와 영어를 동시에 이해하고 구사하는 이중언어 AI라는 점 외에도 텍스트, 음성, 이미지, 영상을 자유자재로 변환할 수 있는 멀티모달형 AI라는 점에서 주목을 받았다. 엑사원은 LG AI연구원이 자체 개발한 알고리즘을 통해 언어를 이미지로(Text to Image), 이미지를 언어로(Image to Text) 변환하는 기술을 구현했다.

이밖에도 네이버는 올 4월 멀티모달 모델을 딥러닝 기반 이미지 검색 서비스 '스마트렌즈'에 적용했다. 텍스트와 이미지 등 복합정보를 활용해 이용자가 검색하고자 하는 결과를 빠르게 찾아주는 서비스다. KT도 이미지와 영상을 텍스트와 함께 다루도록 하는 AI 시스템을 통해 눈·비·역광 또는 대상이 가려진 상황에서도 작은 객체를 높은 정확도로 인식할 수 있는 솔루션을 시연했다. 멀티모달 AI의 활용이 점차 가시화되고 있다는 얘기다.
부작용을 우려하는 목소리도 있다. 김명주 서울여대 교수는 "멀티모달형 AI가 학습하는 기초 데이터 뿐 아니라 AI가 산출한 데이터의 저작권에 대한 논의는 현재 매우 미흡하다"며 "아직은 AI가 사람이 아니라는 이유로 저작권이 전혀 인정되고 있지 않지만 AI활용이 확산될수록 저작권 문제가 커질 수 있으므로 이에 대한 대응책 마련이 필요하다"고 했다.
또 "AI가 만든 콘텐츠가 엽기적이거나 사회통념에 맞지 않을 때 발생할 수 있는 책임 등에 대한 기준도 현재는 없다"며 "학습 데이터의 품질관리를 통해 AI가 만들어내는 콘텐츠들의 윤리적 정합성 문제가 발생할 여지도 고려해야 할 것"이라고 했다.