AI의 '동성애·장애인 혐오', AI로 막는다…'튜닙'의 기술

머니투데이 최태범 기자 2022.08.11 17:01
글자크기
AI의 '동성애·장애인 혐오', AI로 막는다…'튜닙'의 기술


자연어처리 중심 인공지능(AI) 스타트업 튜닙이 윤리성 판별, 비식별화 등 11가지 API(응용프로그램 인터페이스) 서비스를 출시했다고 11일 밝혔다.

튜닙은 카카오브레인 자연어처리 팀 멤버들이 공동 창업한 스타트업이다. 자연어처리(NLP), 초대규모 AI 등 고난도 AI 기술을 자체 개발 중이다. 지난해 11월 펄어비스캐피탈, DSC인베스트먼트, 네이버 D2SF로부터 30억원 규모의 시드투자를 유치했다.



튜닙은 자체 개발한 NLP 엔진 기반의 한국어·영어 API 서비스를 공개했다. 별도의 추가 코딩이나 배경지식이 없어도 사용자가 원하는 단어나 문장을 입력하면 AI가 자동으로 인식해 적합한 결과를 제공한다.

API 중 가장 주목받는 것은 '윤리성 판별(Safety Check)'이다. 혐오 표현을 자동 탐지해 모욕, 욕설, 폭력·위협, 범죄 조장 등 11가지 항목으로 분류한다. 여기에 심각성을 주의, 명백, 심각 등 3단계로 구분하고 순화 표현으로 대체한 결과를 같이 보여준다.



해당 기술이 또 다른 '이루다 사태'를 막을 수 있을지 주목된다. 이루다는 AI 스타트업 스캐터랩이 2020년 크리스마스를 앞두고 출시한 20세 여대생 콘셉트의 AI 챗봇이다. 문맥을 이해하고 자연스럽게 대화하는 능력으로 화제가 됐으나 20일 만에 자취를 감췄다.

일부 이용자의 성적인 대화 유도, 장애인·성소수자 등에 대한 이루다의 혐오 발언 문제에 이어 스캐터랩이 이용자들의 대화 내용을 무단으로 수집했다는 문제까지 터지면서 서비스가 중단됐다. 지금은 문제점을 개선한 '이루다2.0'이 서비스되고 있다.

AI의 '동성애·장애인 혐오', AI로 막는다…'튜닙'의 기술
튜닙의 '비식별화' API는 개인정보보호 및 데이터 활용에 유용하다. 사용자가 입력한 문장에서 이름, 주소, 전화번호, 주민등록번호 등 14개 개인정보 항목을 자동 판별해 삭제, 마스킹, 범주화 등의 방식으로 비식별화한다.


튜닙은 이외에도 △텍스트 분석 △이미지 분석 △영상 분석 △방언 번역 △어린아이 목소리 합성 △감정 분류 △정치 성향 예측 △N행시 △단어 그래프 등 다양한 서비스에 적용 가능한 API 서비스를 공개했다.

튜닙은 이번 API 공개를 시작으로 본격적인 기업 간 거래(B2B)와 기업과 기업·소비자 간 거래(B2B2C) 사업 확장에 나설 계획이다.

박규병 튜닙 대표는 "NLP 분야에 집중해 기존에 없던 차별화된 API 제품을 준비했다"며 "윤리성 판별 등은 실제 현장에서 실용성과 유용성을 입증한 제품이다. 고객 목소리를 반영해 서비스를 고도화하고 가치 있는 여러 API를 연달아 선보이겠다"고 했다.

[머니투데이 스타트업 액셀러레이팅 미디어 플랫폼 '유니콘팩토리']
TOP