머니투데이

'여대생 AI 이루다' 결국 잠정중단…"성차별·혐오대화 사과"

머니투데이 백지수 기자 2021.01.12 05:30
의견 남기기

글자크기

'여대생 AI 이루다' 결국 잠정중단…"성차별·혐오대화 사과"




혐오와 차별적 대화 논란과 개인정보 무단활용 의혹에 휩싸였던 AI 챗봇 '이루다'(루다)가 11일 결국 서비스를 일시 중단했다.

이루다의 개발사 스캐터랩은 이날 오후 입장문을 통해 "일부 혐오와 차별에 대한 대화 사례와 개인정보 활용에 대해 충분히 소통하지 못한 점에 대해 진심으로 사과드린다"며 이같이 밝혔다.

스캐터랩은 "이루다 출시 후 2주 남짓의 시간 동안 75만명에 가까운 이용자들이 루다와 대화를 나눴다"며 "그동안 받은 다양한 의견을 반영해 부족한 점을 집중적으로 보완할 수 있도록 서비스 개선을 거쳐 다시 찾아뵐 예정"이라고 덧붙였다.



"혐오·차별 발언 사과…중요한 문제로 생각"
스캐터랩의 AI 챗봇 이루다가 지하철 임산부석에 대해서도 혐오 표현을 했다는 대화 내용이 누리꾼들 사이에서 공유되고 있다. /사진=트위터리안 @7_0x0_80스캐터랩의 AI 챗봇 이루다가 지하철 임산부석에 대해서도 혐오 표현을 했다는 대화 내용이 누리꾼들 사이에서 공유되고 있다. /사진=트위터리안 @7_0x0_80
스캐터랩은 우선 이루다가 임산부를 비롯한 여성이나 장애인·성소수자 등 사회적 약자에 대한 대화에서 차별적인 답변을 한 사례들에 대해 이용자들에게 사과했다.

스캐터랩은 "저희는 루다의 차별적 발언에 동의하지 않으며 그런 발언은 회사의 생각을 반영하지 않고 있다"고 선을 그었다. 이어 "해당 이슈를 매우 중요하게 생각하고 있다"며 "지난 6개월 간의 베타 테스트를 통해 문제 발생을 미연에 방지하기 위해 여러 조치를 취했다"고 강조했다.

스캐터랩은 또 "특정 집단을 비하하는 호칭이나 혐오 표현은 베타 테스트 기간 동안 발견 즉시 별도의 필터링을 진행했다"며 "기존에 알려진 사례들은 이미 개선을 완료했고 새롭게 발견되는 표현과 키워드를 추가해 차별이나 혐오 발언이 발견되지 않도록 지속적으로 개선 중이다"라고 해명했다.

스캐터랩은 다만 "이루다는 이제 막 사람과 대화를 시작한 어린아이 같은 AI다, 배워야 할 점이 아직 많다"며 양해를 구했다. 또 "이루다는 학습자와의 대화를 그대로 습득하는 것이 아니라, 적절한 답변이 무엇인지 더 좋은 답변은 무엇인지에 대한 판단을 함께 학습하도록 할 것"이라고 향후 개선 방향을 설명했다.

스캐터랩은 "이번 학습을 통해 만들게 될 편향 대화 검출 모델은 모든 분들이 사용하실 수 있게 공개할 계획"이라며 "한국어 AI 대화 연구 및 AI 제품, 그리고 AI 윤리 발전에 유용하게 쓰일 수 있다면 좋겠다"고도 밝혔다.

"개인정보, 취급방침 범위 내에서 활용…불충분한 소통 사과"
'여대생 AI 이루다' 결국 잠정중단…"성차별·혐오대화 사과"
스캐터랩은 회사의 기존 서비스 '연애의 과학'을 통해 수집한 개인들의 사적인 카카오톡 대화가 담긴 텍스트 데이터를 정보 주체 동의 없이 이루다의 기계학습(머신러닝) 학습데이터로 활용했다는 논란에도 사과했다.

'연애의 과학'은 이용자들로부터 연인 또는 관심있는 상대와의 카톡 대화를 텍스트 파일로 제공받아 친밀도 등 심리 분석을 제공하는 서비스다. 스캐터랩은 연애의 과학 개인정보취급방침에서 '수집된 개인정보는 신규 서비스 개발에 활용한다'고 고지했다. 스캐터랩은 이루다를 구성하는 AI 알고리즘을 설명하면서 이루다에게 연애의 과학을 통해 수집된 카톡 대화 100억여건을 학습시켰다고 밝힌 바 있다.

스캐터랩은 이와 관련 "사전에 동의가 이루어진 개인정보취급방침의 범위 내에서 활용한 것"이라면서도 "연애의 과학 사용자분들께서 이 점을 명확히 인지할 수 있도록 충분히 소통하지 못한 점에 대해서 책임을 통감하며 진심으로 사과한다"고 밝혔다.

스캐터랩은 다만 카톡 데이터를 이루다에게 활용할 때는 특정 개인을 알아볼 수 없도록 비식별화·익명화 조치를 했다고 해명했다. 앞서 이루다 이용자들 사이에서는 특정 개인의 주소나 실명, 계좌번호 등이 이루다의 답변을 통해 노출되고 있다는 제보가 이어졌다.


스캐터랩은 "데이터 활용 시 사용자의 닉네임, 이름, 이메일 등의 구체적인 개인 정보는 이미 제거 돼 있다"며 "개인을 특정할 수 있는 정보는 유출되지 않았다"고 해명했다.

이어 "향후로는 데이터 사용 동의 절차를 명확하게 하고 식별이 불가능한 정보라도 민감해 보일 수 있는 내용에 대해서는 지속적인 알고리즘 개선을 통해 보완하겠다"고 덧붙였다.

이 기사의 관련기사

나의 의견 남기기 등록
TOP