모방 넘어 창조로…두달 만에 작품 가치 7배 뛴 이 작가님

머니투데이 윤지혜 기자, 배한님 기자, 황국상 기자 2022.08.26 07:00

글자크기

[MT리포트] 초거대 AI 대전 시즌2(上)

편집자주 국내 빅테크들이 초거대 AI 구축 경쟁에 뛰어든지 1년이 지났다. 초거대 AI는 단순히 사람의 말을 이해하는 것을 넘어 이를 바탕으로 시를 쓰고 그림을 그리는 '창의적 AI'로 진화하는 추세다. 국내 초거대 AI 상용화 현주소와 과제를 점검해 본다.
AI가 10초 만에 그린 호랑이 그림…"가격 7배 뛰었다"
① 인간 창의성에 도전장 낸 AI



카카오브레인 AI 작가 '칼로'가 생성한 '네오 브레인 타이거'. /사진=클립드롭스 캡처카카오브레인 AI 작가 '칼로'가 생성한 '네오 브레인 타이거'. /사진=클립드롭스 캡처


"안녕, 나는 AI(인공지능) 작가 칼로야. 2022년 너의 세상에서 호랑이란 참 특별한 존재더라. 그래서 나도 내 세상의 호랑이를 만들었어."

카카오브레인의 AI 작가 칼로가 그린 호랑이 그림 '네오 브레인 타이거'에대한 설명이다. 25일 관련업계에 따르면 칼로의 호랑이 그림 28종 중 1개가 NFT(대체불가토큰) 거래 플랫폼 '클립드롭스'에서 700클레이튼(KLAY)에 판매됐다. 당시 시세로 약 24만원 수준이다. 지난 5~6월 클립드롭스에서 민팅 당시 100클레이였던 점을 고려하면 두 달만에 가치가 7배로 뛴 셈이다.



칼로는 카카오브레인의 초거대 AI 이미지 생성모델 '민달리'(minDALL-E)와 'RQ-트랜스포머'를 종합해 탄생한 AI 작가다. 1억2000만장의 텍스트와 이미지 데이터 세트를 학습해 명령어를 입력하면 이를 바탕으로 다양한 화풍과 스타일로 이미지를 만든다. 초거대 AI가 인간의 언어를 이해하는 것을 넘어, 인간 고유영역으로 여겨진 창의성에 도전장을 낸 것이다.

지난 7월 칼로와 협업한 작품을 선보인 고상우 작가는 "'파란 호랑이'·'빨간 호랑이' 등의 실행어를 주면 어느 AI나 (그림을) 만들어낼 수 있지만, '부자 호랑이'·'가난한 호랑이' 등 추상적인 문구를 입력해도 칼로는 그 언어를 이해하는 능력을 보여줬다"라며 "AI는 인간을 돕는 보조자 역할로 생각하기 쉬운데 스스로 창작할 수 있는 능력까지 갖췄다"고 말했다.



칼로가 '길에서 기사쓰는 기자'를 팝아트풍으로 생성한 그림. /사진=갤럭시 북 아트 프로젝트칼로가 '길에서 기사쓰는 기자'를 팝아트풍으로 생성한 그림. /사진=갤럭시 북 아트 프로젝트
일반인도 삼성전자 '갤럭시 북 아트 프로젝트'에서 칼로를 체험할 수 있다. 예컨대 '바다에서 수영하는 유니콘' 등의 3가지 키워드를 입력하고 팝아트·클래식·카툰 등 5가지 화풍 중 하나를 선택하면 칼로가 10초 이내로 그림을 완성한다. 다만 카카오브레인은 부적절한 이미지 생성을 막기 위해 일부 키워드를 제한했는데, 아직 칼로가 특정 문구를 필터링할 수 있는 수준이 아니어서다.


이 밖에도 CJ올리브네트웍스의 AI '에어트가' 류재춘 화백의 수묵산수화 '월하'(月河)를 채색한 '월화2021′는 지난 연말 업비트 NFT에서 개당 0.014비트코인(당시 시세로 약 100만원)에 완판됐다. LG의 AI 작가 '틸다'는 뉴욕 패션위크에서 박윤희 디자이너와 '금성에서 핀 꽃'을 주제로 패션쇼를 열었다. 200여개 의상은 틸다가 만든 이미지 3000여장 기반으로 제작됐다.

렘브란트 뛰어넘을까…'포르노 생성기'는 우려

오픈AI '달리2'가 그린 털실로 짠 괴물처럼 보이는 수프 그릇'(왼쪽)과 '말을 타고 있는 우주비행사'. /사진=오픈AI오픈AI '달리2'가 그린 털실로 짠 괴물처럼 보이는 수프 그릇'(왼쪽)과 '말을 타고 있는 우주비행사'. /사진=오픈AI
그동안 그림 그리는 AI는 많았으나 창작이 아닌 모작에 그쳤다. 2016년 마이크로소프트의 AI '넥스트 렘브란트'가 네덜란드 화가 렘브란트의 작품 346개를 학습해 그의 화풍을 재현한 게 대표적이다. 당시 '렘브란트의 부활'이라는 평가까지 나왔으나, 이제는 렘브란트를 뛰어넘는 AI 화가의 탄생도 기대할 수 있게 됐다.

실제 오픈AI의 달리2(DALL-E 2)는 '털실로 짠 괴물처럼 보이는 수프 그릇', '말을 타고 있는 우주비행사' 등 난해한 명령어도 작품으로 만들어낸다. 달리2는 지난해 공개된 달리1보다 4배 큰 해상도에 사실적이고 정교한 그림을 생성한다. 사진 속 고양이를 강아지로 바꾸거나, 질감·반사·그림자도 자연스럽게 수정한다. 오픈AI는 "이미지와 이미지를 설명하는 텍스트 간 관계를 학습한 덕분"이라고 설명했다.

한편에선 AI가 선정적, 폭력적인 그림을 그릴 수 있다고 우려한다. 실제 미국 최대 온라인 커뮤니티 레딧에 따르면 스태빌리티.AI의 '스테이블 디퓨전' 베타 테스트에서 여성 나체 등 고화질의 선정적 이미지를 생성할 수 있어 논란이 됐다. '타노스가 된 일론머스크', '인어공주가 된 엠마 왓슨'처럼 실존 인물 딥페이크로도 활용되는 것으로 나타났다.

이에 한 이용자는 "AI가 만드는 포르노가 코앞에 있다"며 "오디오·비디오 합성모델도 계획하고 있고, 이건 하나의 오픈소스 조직일 뿐이므로 상황은 점점 더 미쳐갈 것(keep getting crazier)"이라고 꼬집었다.

네카오부터 이통사·LG까지 빅테크들 '초거대 AI' 상용화 속도전
② 파라메타 확대보다는 실적용해 학습량 늘리는 추세

/사진=게티이미지뱅크/사진=게티이미지뱅크
2020년 미국의 인공지능 연구소 오픈AI가 인공지능(AI) 모델 'GPT-3'를 선보이면서 '초거대 AI' 시대가 열렸다. 1750억개 파라미터(매개변수)를 적용한 GPT-3의 등장으로 AI가 인간처럼 자연스러운 대화를 생성할 수 있게 됐다. '매개변수'는 어떤 입력값을 넣었을 때 원하는 결과를 얻기 위해 AI가 찾아야 하는 변수를 뜻하는데, 이 매개변수의 규모가 AI 모델의 크기를 나타낸다. 사람의 뇌에서 뉴런을 연결해 정보를 학습하고, 기억하는 역할을 담당하는 시냅스와 유사하다. 인간은 평균 100조개의 시냅스를 갖고 있다.

지난해까지 많은 AI 기업이 매개변수를 늘리고 AI 모델 크기를 키우는데 집중했다. AI 모델이 가진 매개변수의 수가 인간 시냅스를 넘어설 때, 비로소 인간의 뇌처럼 복잡하고 많은 문제를 해결할 수 있다고 믿었기 때문이다. 그러나 최근 이를 뒤집는 연구결과가 나오며 '초거대 AI' 분야는 전환점을 맞았다. 완성도를 높이기위한 '매개변수'보다 빅데이터로 '학습량'을 늘리는 게 AI 성능 향상에 더 도움될 수 있다는 것이다.

"거거익선? NO!" 실용구간 내라면 상용화가 먼저

구글 딥마인드가 지난 4월 발표한 연구에서도 700억개의 매개변수를 가진 자사의 초거대 AI 모델 '친칠라'가 2800억개의 매개변수를 가진 기존 모델 '고퍼'보다 우수했다. 친칠라는 오픈AI의 GPT-3도 능가했다.

국내에서도 지난해까지 초거대 AI 분야에서 파라미터 개수를 확대하는 '모델 크기' 경쟁이 벌어졌다. SK텔레콤 (49,450원 ▲400 +0.82%)이 지난해 4월부터 1500억 파라미터를 목표로 GLM(한국어 범용 언어 모델) 개발에 착수했고, 같은 해 5월 네이버(NAVER (204,500원 0.00%))가 오픈AI의 GPT-3를 뛰어넘는 2040억개 매개변수 규모의 하이퍼클로바를 선보였다. LG AI 연구원도 하반기 중으로 6000억개 파라미터를 갖춘 초거대 AI를 내놓겠다고 선언하기도 했다. 그러나 최근에는 초거대 AI의 실서비스 적용을 통한 데이터 학습에 더 무게를 두는 분위기다. 김일두 카카오브레인 대표는 지난해 말 카카오의 '초거대 AI 로드맵'을 공개하며 실용성 있는 언어 모델 크기는 60~800억 파라미터라고 밝혔다.

네카오부터 이통3사까지…초거대 AI 상용화 박차

모방 넘어 창조로…두달 만에 작품 가치 7배 뛴 이 작가님
네이버는 지난해부터 쇼핑·검색·챗봇·AI스피커 등 네이버 서비스 전반에 초거대 AI를 적용해왔다. 특히 '클로바 스튜디오'를 통해 스타트업도 '하이퍼클로바'를 활용할 수 있도록 했다. 현재 100여 개 스타트업이 클로바 스튜디오를 사용하고 있다.

카카오는 지난해 11월 GPT-3의 한국어 특화 AI 언어모델인 'KoGPT'를 올들어 실제 서비스에 적용하고 있다. 시 쓰는 AI 모델 '시아'가 대표적이다. 카카오브레인은 지난 8일 시아가 쓴 53편의 시를 담은 시집을 출간하기도 했다. 김일두 대표가 제시한 상용화 최소 규모인 '60억개' 파라미터로 상용화에 성공한 것이다.

이통3사도 본격적으로 초거대 AI 상용화 경쟁에 뛰어들었다. SK텔레콤은 GPT-3를 기반으로 한국어 특화 모델을 자체 개발하고, 지난 5월 이를 활용한 성장형 AI 서비스 '에이닷(A.)'을 공개했다. 에이닷은 자연어 처리(NLP) 기술과 감정 분석 기술 등을 적용해 일상적 대화나 특정 모바일 작업을 처리해준다.

KT (30,850원 ▲250 +0.82%)는 연내 상용화를 목표로 초거대 AI를 개발 중이다. 카이스트나 한국전자통신연구원(ETRI) 등이 속한 'AI 원팀'이 초거대 AI 언어모델을 개발하고 있으며, 초거대 AI 완성 즉시 상용화할 수 있도록 준비 중이다. KT는 먼저 초거대 AI를 AI 스피커 기가지니와 AICC(인공지능 컨택센터) 서비스 고도화에 활용할 계획이다.

LG유플러스 (11,170원 ▲90 +0.81%)는 LG그룹 차원에서 개발한 초거대 AI 모델 '엑사원'을 활용해 자사 AI 서비스를 고도화할 전망이다. 현재 LG유플러스가 엑사원으로 준비 중인 서비스는 IPTV에 적용할 'AI 콘텐츠 큐레이터' 서비스다. AI 콘텐츠 큐레이터는 개인별 시청 성향을 기반으로 검색 또는 소개 화면에서 콘텐츠 소개 문구나 문장을 자동완성 해 준다.

문장 넘어 그림·영상·표정까지 읽는다...AI, 점점 더 사람처럼 진화
③ 언어넘어 음성, 이미지, 표정까지 이해하는 AI로 진화

/사진제공=이미지투데이/사진제공=이미지투데이
최근 '초거대 AI(인공지능)'는 멀티모달(Multi-modal) 기술을 통해 보다 한층 더 진화하고 있다.

멀티모달 AI는 다양한 모달리티(Modality, 의사소통의 채널)를 동시에 받아들이고 사고하는 AI 모델을 의미한다. 기존 초거대 AI가 주로 언어에 초점을 둔 언어 모델이었다면 멀티모달 AI는 텍스트(문자) 데이터 외에도 이미지, 음성, 제스쳐, 시선, 표정, 생체신호 등 여러 입력방식(모달리티)을 받아들이고 사고할 수 있다. 인간과 AI가 더 자연스레 소통할 수 있다는 얘기다.

앞서 오픈AI는 초거대 AI 인 GPT-3에 이어 지난해 거대 멀티모달 AI인 달리(DALL-E)를 공개했다. GPT-3가 방대한 언어데이터를 학습해 활용한다면 달리는 텍스트와 더불어 이미지를 학습해 새로운 결과물을 만들어낸다. 올해 4월 등장한 달리2는 기존보다 이미지가 정교해지고 속도도 빨라졌다. 복잡한 배경과 그림자, 음영 까지 묘사한 사실적인 이미지에 수정사항도 지시할 수 있다.

국내에서도 카카오브레인이 기존의 민달리(minDALL-E)와 RQ트랜스포머(RQ-Transformer)를 융합해 하나의 페르소나인 '칼로'(Karlo)를 만들어냈다. 이것들은 모두 텍스트 명령어에 매칭되는 이미지를 만들어주는 멀티모달형 시스템이다.

LG AI연구원의 엑사원 역시 한국어와 영어를 동시에 이해하고 구사하는 이중언어 AI라는 점 외에도 텍스트, 음성, 이미지, 영상을 자유자재로 변환할 수 있는 멀티모달형 AI라는 점에서 주목을 받았다. 엑사원은 LG AI연구원이 자체 개발한 알고리즘을 통해 언어를 이미지로(Text to Image), 이미지를 언어로(Image to Text) 변환하는 기술을 구현했다.
(서울=뉴스1) = LG는 14일(현지시간) 미국 '뉴욕 패션위크'에서 세계 최초 초거대 인공지능(AI) 기반 아티스트인 '틸다(Tilda)'를 공개했다고 15일 전했다.   틸다는 LG AI연구원의 초거대 AI인 '엑사원(EXAONE)'으로 구현한 첫 번째 AI 휴먼이다. 지금까지 나온 가상 인간들과 달리 스스로 학습해 사고하고 판단하며 기존에 없는 새로운 창작물을 만들고 인간과 자연스럽게 소통할 수 있다. (LG 제공) 2022.2.15/뉴스1  (서울=뉴스1) = LG는 14일(현지시간) 미국 '뉴욕 패션위크'에서 세계 최초 초거대 인공지능(AI) 기반 아티스트인 '틸다(Tilda)'를 공개했다고 15일 전했다. 틸다는 LG AI연구원의 초거대 AI인 '엑사원(EXAONE)'으로 구현한 첫 번째 AI 휴먼이다. 지금까지 나온 가상 인간들과 달리 스스로 학습해 사고하고 판단하며 기존에 없는 새로운 창작물을 만들고 인간과 자연스럽게 소통할 수 있다. (LG 제공) 2022.2.15/뉴스1
과학 학술논문 등에 삽입된 각종 화학식이나 그래프, 도표 등의 경우도 종전에는 엔지니어들이 일일이 그 의미를 입력해 컴퓨터에게 학습시켜줬어야 했지만 이제는 엑사원이 스스로 일정 수준 해당 화학식 등의 의미를 인식, 의미있는 데이터로 재가공할 수 있다. 엑사원은 LG전자, LG화학, LG CNS 등 계열사들이 보유하고 있는 전문 데이터를 포함해 논문, 특허 등의 정제된 말뭉치들을 학습해 다양한 산업 분야에서 전문가로 활약할 가능성을 높여 가고 있다.

이밖에도 네이버는 올 4월 멀티모달 모델을 딥러닝 기반 이미지 검색 서비스 '스마트렌즈'에 적용했다. 텍스트와 이미지 등 복합정보를 활용해 이용자가 검색하고자 하는 결과를 빠르게 찾아주는 서비스다. KT도 이미지와 영상을 텍스트와 함께 다루도록 하는 AI 시스템을 통해 눈·비·역광 또는 대상이 가려진 상황에서도 작은 객체를 높은 정확도로 인식할 수 있는 솔루션을 시연했다. 멀티모달 AI의 활용이 점차 가시화되고 있다는 얘기다.

부작용을 우려하는 목소리도 있다. 김명주 서울여대 교수는 "멀티모달형 AI가 학습하는 기초 데이터 뿐 아니라 AI가 산출한 데이터의 저작권에 대한 논의는 현재 매우 미흡하다"며 "아직은 AI가 사람이 아니라는 이유로 저작권이 전혀 인정되고 있지 않지만 AI활용이 확산될수록 저작권 문제가 커질 수 있으므로 이에 대한 대응책 마련이 필요하다"고 했다.

또 "AI가 만든 콘텐츠가 엽기적이거나 사회통념에 맞지 않을 때 발생할 수 있는 책임 등에 대한 기준도 현재는 없다"며 "학습 데이터의 품질관리를 통해 AI가 만들어내는 콘텐츠들의 윤리적 정합성 문제가 발생할 여지도 고려해야 할 것"이라고 했다.
TOP