서울 서초구의 KT 융합기술원에서 연구원들이 AI원팀에서 개발한 AI 기술을 살펴보고 있다./사진제공=KT
KT의 AI 사업에 활용되는 기술은 △로봇 실내 공간지능 기술 △로봇 소셜 인터랙션(Social Interaction) 기술 △보이스 클로닝(Voice Cloning) 기술 △한국어 E2E 음성인식 트랜스퍼 러닝(Transfer learning) 등이다.
우선 로봇 실내 공간지능 기술은 KT와 명현 한국과학기술원(KAIST) 교수가 함께 개발했다. 로봇이 실내 공간의 사물을 식별하고 위치를 기억하는 기술이다. 로봇이 공간 내 사람이나 사물 등 객체의 종류와 위치를 인식해 3D 지도를 생성하거나 실시간 업데이트도 할 수 있다. AI원팀은 이 기술을 실내 자율주행에 접목하는 연구를 지속할 예정이다.
KT와 김회린 KAIST 교수가 공동 연구한 보이스 클로닝 기술은 개인화 음성합성을 위한 목소리 복원 알고리즘이다. 개인의 오디오 샘플을 딥러닝으로 학습해 커스텀 보이스를 제공하는 개인화 TTS 서비스의 핵심 기술이다. 연구진은 커스텀 보이스 학습에 필요한 녹음 시간을 기존 30분에서 3분으로 단축했다.
KT와 장준혁 한양대 교수가 개발한 한국어 E2E 음성인식 트랜스퍼 러닝 기술은 기존 최고 성능을 내는 딥러닝 음성인식 모델 대비 에러율을 13.7% 떨어뜨렸다 .또 모델을 처음부터 다시 학습하는 것이 아닌 기존 모델을 재사용하는 방식으로 소량의 도메인 데이터를 활용한 음성인식 개선이 가능해졌다.
이 시각 인기 뉴스
AI 원팀은 KT를 비롯해 현대중공업그룹, LG전자, 한국투자증권, 동원그룹, 우리은행, ㈜한진, 한국과학기술원(KAIST), 한양대, 한국전자통신연구원(ETRI)까지 총 10개 산학연이 참여하고 있다.