AI가 그림 그린다…카카오, 두번째 초거대 AI 'minDALL-E' 공개

머니투데이 백지수 기자 2021.12.15 11:08
글자크기
카카오브레인이 개발한 한국어 초거대AI '민달리(minDALL-E)' 모델이 그린 그림 예시 /사진=카카오브레인카카오브레인이 개발한 한국어 초거대AI '민달리(minDALL-E)' 모델이 그린 그림 예시 /사진=카카오브레인


카카오가 한국어로 글을 쓰고 한국어 명령에 따라 그림을 그릴 수 있는 인공지능(AI) 모델을 개발해 15일 공개했다.

카카오브레인은 이날 초거대 AI 멀티모달(multimodal·여러 형태로 컴퓨터와 대화하는 기능) 'minDALL-E(민달리)'를 세계 최대 오픈소스 커뮤니티 깃허브(github)에 공개했다고 밝혔다. 카카오의 두번째 한국어 초거대 AI 모델이다.

'minDALL-E'는 이용자가 텍스트로 명령어를 입력하면 실시간으로 원하는 이미지를 만들어 주는 이미지 생성 모델이다. 미국 오픈AI사의 AI 'DALL-E'를 누구나 접근하기 쉽게 작은 사이즈 모델로 구현했다. 1400만장의 이미지와 이에 대응되는 텍스트 세트를 사전 학습했다.



minDALL-E를 이용하면 "바나나 껍질로 만든 의자 그려줘", "보름달과 파리 에펠탑이 같이 있는 그림 보여줘", '살바도르 달리 화가 스타일로 그려줘" 같은 한국어 명령으로 그림을 그릴 수 있다. 검색을 통해 기존의 이미지를 찾아내는 것이 아니라 AI가 스스로 명령을 이해하고 직접 이미지를 그린다. 스토리텔링 콘텐츠의 삽화를 만들거나 교육 자료 제작 등에 활용하는 등 다양한 콘텐츠 산업에 이미지를 적용할 수 있을 것으로 기대된다.

카카오브레인은 지난달 한국어 특화 초거대 AI 언어 모델 'KoGPT'도 선보였다. 카카오브레인은 KoGPT 모델의 성능 고도화에도 집중하고 있다고 밝혔다. 구글이 개발한 텐서 처리 장치 '구글 TPU'를 활용해 1EF(엑사플롭스, 초당 100경 규모의 연산을 처리하는 속도)를 뛰어넘는 국내 최대 규모 딥러닝 슈퍼컴퓨팅 인프라를 도입하는 한편 KoGPT 모델의 매개변수(파라미터)를 60억개에서 300억개로 5배 늘려 명령 이행 정확도를 높였다는 설명이다.



카카오브레인은 오는 17일 자체 기술 컨퍼런스인 '오픈 미니 컨퍼런스'를 온라인으로 개최하고 KoGPT와 minDALL-E에 대해 보다 자세히 설명한다.

김일두 카카오브레인 대표는 "최근 공개한 언어 모델 KoGPT과 이번에 공개한 minDALL-E를 시작으로 순차적으로 초거대 AI의 다양한 모델을 공개할 것"이라며 "차세대 딥러닝 구축을 위한 필수 연구 과정으로 해당 모델을 오픈 소스로 공개해 국내 IT 생태계 기술 발전에 기여하겠다"고 말했다.

TOP