마인즈랩, 음성 AI 고난도 기술 '화자분리' 성과

머니투데이 최태범 기자 2021.04.15 16:33
글자크기
마인즈랩, 음성 AI 고난도 기술 '화자분리' 성과


인공지능(AI) 전문기업 마인즈랩이 AI 청각지능 분야에서 난이도가 높은 기술로 평가되는 ‘화자분리’ 연구 성과를 공유했다.

15일 마인즈랩에 따르면 지난 13일 한국전자통신연구원(ETRI)이 주최한 ‘ETRI-마인즈랩 기술교류 세미나’에서 마인즈랩은 사람의 음성 샘플이 없어도 두 사람의 발화를 분리하는 ‘Sampleless Speech Separation’ 기술을 소개했다.

세미나에 참석한 ETRI 연구원들은 마인즈랩의 기술력에 큰 호응을 보냈다. ETRI 측은 최신 종단형 음성인식 엔진 기술 개발의 성과에 대해 발표하며 서로의 노하우를 공유했다.



마인즈랩은 설립 초기에는 자연어 처리와 음성인식 등 ETRI로부터 이전받은 기술을 사용했다. 이후 자체적인 AI 연구조직에 꾸준히 투자해 이전받은 기술 이상의 자체 기술을 보유하게 됐다.

기술개발을 총괄하는 최홍섭 대표는 “기술이전을 받은 연구소기업이 바람직한 방향으로 성장한 모범적 사례”라며 “이번 세미나는 자체 역량이 성숙해 AI 연구개발 파트너로서 학술적인 교류를 할 수 있게 됐다는 점에 상징적 의미가 있다”고 했다.



한편 마인즈랩은 맞춤형 AI 서비스를 제공하는 마음클라우드를 중심으로 AI 컨택센터, 스마트시티, 회의록 등 기업·공공기관 대상으로 다양한 사업을 진행하고 있다.

최근에는 음성·시각·언어(사고)·아바타 등 AI 관련 기술을 집대성한 AI 휴먼 ‘M1’을 공개했다. 사용자의 음성을 95% 이상 이해하고 0.5초 이내 분석한 뒤 응답할 수 있도록 설계됐다.

비목적성(일상적) 대화뿐만 아니라 음식주문·뉴스검색을 비롯해 전문적인 지식·정보전달 등 목적성 대화도 90% 이상 가능하다. 3D 아바타의 시선 처리, 얼굴 각도, 입 꼬리 변화 등을 통해 사용자에게 실제 사람과 대화하는 듯한 경험을 줄 수 있다.

TOP