AI아트랩이 쓴 시/자료=포스텍
B: “그대의 젊은 아름다운 길을.”
A: “항상 함께였던 너와 나.”
B: “너는 나를 보냈다. 내 마음은 그 속에서”
시(詩)를 한 구절씩 나누는 A, B는 연인 사이일까? 아니다. A는 인간, B는 인공지능(AI)이다. 국내 처음으로 ‘시 쓰는 AI’가 등장했다. 포스텍(옛 포항공대) 정보통신연구소 조형배·서찬양 연구원이 공동개발한 ‘AI 아트랩(연구 프로젝트명)’이 주인공이다.
연구진은 AI아트랩에게 시 작성법을 가르치기 위해 한국어 시 10만5399행을 읽게 했다. 아예 말뭉치를 학습해 문장을 대화처럼 이어갈 수 있도록 챗봇용 문장 학습 모델 ‘시퀀스투시퀀스’(Sequence to Sequence)도 적용했다.
AI아트랩은 이미 학습된 시 구절 데이터를 그대로 가져다 쓰는 일이 없다. 조형배
연구원은 “기존에 학습한 시 문장을 그대로 모방하는 일은 없다”며 “만약 ‘그대의’라는 단어를 주면 그 다음에 가장 자연스럽게 연결될 만한 ‘사랑은’, ‘타오르는’ 등의 단어를 ‘확률 기반 모델’ 분석을 통해 제시한다”고 설명했다.
AI아트랩이 만든 시는 저작권을 인정받을 수 있을까. 연구진은 “시인들도 기존에 있는 시를 보고 공부하듯, AI아트랩도 10만행의 시를 읽고 배웠으며, 학습한 데이터에 없는 창작시를 완성한다”며 “하지만 이와 관련한 판례가 없어 저작권을 주장하기도 힘들다”고 말했다. 다만, 작품의 저작권은 없다 해도 소유권은 주장할 수 있을 것이라는 귀띔이다.
(사진 왼쪽부터)포스텍 정보통신연구소 조형배, 서찬양 연구원/사진=포스텍
이 시각 인기 뉴스
개발 과정에선 한국어를 학습시키는개 난제였다는 설명이다. AI아트랩은 이를테면 뜨거운 국물을 먹으면서도 “와~시원한다”라고 말하는 표현을 이해하지 못했다. 조사 ‘은’과 ‘는’ 역시 구분하지 못했다. 서 연구원은 “영어는 알파벳의 간단한 조합인 데다 띄워 쓰기만으로도 구분할 수 있지만, 한글은 음절, 글씨 단위 요소가 1만개가 넘고 변형도 많아 형태소로 나눠 상황에 맞는 뜻을 몇 날 며칠간 일일이 알려줘야 했다”며 “외국인과 마찬가지로 AI도 한국어를 매우 어려워했다”고 말했다.
연구진은 “AI아트랩은 시를 통한 즐거움 등 갖가지 영감을 안겨준다”며 “인간의 메마른 정서를 순화해 주는 역할을 할 것”이라고 강조했다.