"韓 토박이가 유창한 발음으로 영어를?"···KT가 자랑한 AI 원천기술 보니..

머니투데이 김세관 기자 2019.10.30 16:00
글자크기

4개 분야 20여개 원천기술 중 일부 공개···"너무 긴장돼"말하자 "쫄지마"

/사진제공=KT/사진제공=KT


KT (33,300원 ▼350 -1.04%)가 30일 서울 광화문 KT스퀘어에서 기자간담회를 열고 인공지능(AI) 전문기업으로의 변신을 선언했다. 향후 4년간 3000억원을 투자하고, 전문 인력도 1000명을 육성한다.

아울러 KT는 이날 지금까지 공개되지 않았던 '감성·언어 지능', '영상·행동 지능', '분석·판단 지능', '예측·추론 지능' 등 4개 영역의 20여개 AI 원천 기술 중 일부를 공개했다. 지금까지 한 번도 KT가 외부에 노출하지 않았던 내용들이다. 가장 관심을 끌었던 AI 기술 시연 가운데 4개를 요약해 봤다.



◇차가 지나가도, 매미가 울어도 사람 목소리만 '쏙'= KT는 이날 간담회에서 자동차나 메미가 우는 등의 엄청난 소음 속에서도 사람의 목소리를 분리해 인식하는 '스피치 세퍼레이션(Speech Separation) 기술'을 시연했다.

주방의 물소리와 진공 청소기 소리가 시끄러운 가운데, 시연자가 "잡음에 강한 KT 음성 분리 기술"이라고 말하자 스피치 세러페이션의 소프트웨어가 주변의 잡음을 걸러낸 후 시연자의 목소리만 정확히 감지해 인식했다. 우리말 뿐만 아니라 "Welcome to the KT press Conference"라는 영어 음성까지 스피치 세퍼레이션이 그대로 분리해 인식했다. 한국어와 영어를 동시에 말해도 각각 구별해 냈다.



KT는 "세계 최초로 하나의 마이크에 들리는 모든 목소리를 언어에 구애받지 않고 각각 구별해 낼 수 있는 기술"이라고 밝혔다.

◇"나 너무 긴장돼"말하자 친구처럼 "쫄지마"= 영화 '허(Her)'에 나오는 AI 비서 사만다와 '아이언맨'의 자비스와 같이 AI가 이용자와 감성대화를 할 수 있는 MRC(Machine Reading Comprehension) 기술도 이날 공개됐다.

시연자가 "지니야 아이폰11이 인기가 있는 이유가 뭐야?"라고 우선 물었다. 현재 상용화 된 AI 들은 대부분 답을 하지 못 한다. 그러나 MRC가 적용된 AI는 같은 질문에 "웹(인터넷)에서 찾아봤는데요. 전작에 비해서 출고가가 인하됐고 카메라 성능 개선이 이뤄진 점 등이 주효했다고 하네요"라고 말했다. 이용자의 질문에 대한 답을 스스로 웹에서 검색해 들려줄 수 있었다.


KT 직원이 MRC 기술이 적용된 AI와의 대화를 시연하는 모습/사진=김세관 기자.KT 직원이 MRC 기술이 적용된 AI와의 대화를 시연하는 모습/사진=김세관 기자.
뿐만 아니라 "나 지금 너무 긴장돼"라고 말하자 "까짓거 쫄지마"라고 답했으며, "너 말투가 왜그래"라고 묻자 "니가 반말하면 나도 반말한다" 등 마치 친구와 대화하는 것처럼 AI와 소통할 수 있는 모습도 MRC 기술을 통해 구현됐다.

◇"韓 토박이가 유창한 발음으로 영어를?= 한국에서 태어난 토박이가 유창한 미국식 영어로 아이들에게 동화를 들려줄 수 있는 영어 개인화 음성합성(English P-TTS) 기술도 이날 시연됐다.

KT의 영어 P-TTS 소프트웨어가 시연자의 목소리를 배우고 있는 모습./사진=김세관 기자.KT의 영어 P-TTS 소프트웨어가 시연자의 목소리를 배우고 있는 모습./사진=김세관 기자.
시연자가 한 문장의 영어를 녹음하고 AI에게 학습을 시키자 1분만에 시연자의 목소리로 유창한 미국식 발음의 영어 동화 구현이 실행됐다. 두 문장, 세 문장을 학습시키면 더 이용자의 목소리에 가까운 소리를 낼 수 있다고 KT는 설명했다.

영어 P-TTS 기술이 시연되면 실시간 통역 대화, 전화상담, 감성 AI 친구, 지능형 회의 솔루션 등의 서비스에 활용될 수 있을 것으로 기대된다.

◇"이것이 진짜 AI 비서"…웹페이지 검색해 이메일까지 보낸다= AI가 인터넷 웹페이지를 분석해 이용자의 요청 사항을 그대로 실행하는 기술 시연도 진행됐다. 시연자가 "KT에서 광고모델로 활동중인 축구 선수 어린시절 사진을 찾아서 이메일로 보내줘"라고 말하자 AI가 스스로 KT 광고모델인 이강인 선수의 어린시절 사잔을 찾아 다운로드 받은 후 알아서 이메일을 보냈다.

해당 기술은 웹페이지가 언제 어떻게 바뀌어도 같은 명령에 대해 능동적으로 대처할 수 있어 진정한 AI 비서 역할을 수행하는 서비스 구현에 적합하다고 강조했다.
KT는 이 같은 기술들을 자연스럽게 현재 서비스되고 있는 KT의 AI 플랫폼 '기가지니'에 적용할 예정이다.

이 기사의 관련기사

TOP