AI '이루다'가 우리 딸 어린이집 주소를 알고 있었다

머니투데이 이강준 기자, 박수현 기자 | 2021.01.22 04:35
AI 챗봇 '이루다'/사진제공=스캐터랩

#1 서울시 양천구 목3동 XX번지. 가족들 밖에 모르는 딸 어린이집 주소를 인공지능 챗봇 '이루다'가 읊고 있었다. 생활반경, 계좌번호까지도 말했다. 이루다는 해맑게 남편의 말투를 사용했다.

#2 어느날 갑자기 친구가 한 사진을 보냈다. "김병준(가명)이 너 전남자친구 아냐?"라고 물었다. 이루다가 2년 전 헤어진 전 남친 이름을 부르고 있었다. 말투도 두 사람간에 주고 받았던 카톡 대화 내용과 표현을 닮아있었다. 섬뜩했다.

실제 연인·가족과 나눈 카카오톡 메시지가 '이루다' 개발에 사용됐다는 사실이 알려지면서 피해 사례가 속출하고 있다. 이루다 개발사 스캐터랩은 자사 앱 '연애의과학'에서 수집한 카톡 데이터를 사용한 바가 있다고 인정했다. 피해자들은 집단소송에 나섰다.

21일 스캐터랩 측에 집단소송을 준비하는 피해자들에 따르면 이들은 연애의과학 유료 서비스 '카톡으로 보는 속마음' 등을 통해 회사에 실제 카톡 내역을 제공했다. 이 서비스는 앱 내 화폐인 '코인'을 내면 카톡 대화를 분석해 대화 당사자들의 감정, 애정도를 측정해준다.

카톡 내용은 특정 기간 동안 당사자와 나눈 대화 전체 파일을 스캐터랩에 제출하도록 돼있다. 기간엔 한도가 없기 때문에 짧게는 한 달, 길게는 10년 가까이 나눈 카톡을 제출한 이용자도 있다. 회사 측이 이렇게 모은 카톡만 100억건에 달한다. 이 중 1억건은 챗봇 '이루다' 데이터로 활용됐다.




결혼 무산된 예비부부, 성추행 상담, 자녀 어린이집 주소까지 전부 유출됐다


문제는 카톡 분석 서비스 이용자들에게 카톡 데이터를 '이루다' 개발에 쓸 수 있다는 공지가 전달되지 않았다는 점이다. 오히려 "데이터는 오직 카카오톡 분석에만 사용되니까 안심해달라. 평생을 걸고 약속드린다"는 취지의 안내가 있었다는 게 피해자들 증언이다.

이날 인터뷰한 피해자들은 "'제공된 카톡은 분석 목적 외에는 사용되지 않는다'고 안내해서 안심했었다"며 "이것 외에 데이터가 쓰일줄 알았다면 절대 서비스를 이용하지 않았을 것"이라고 입을 모았다.


피해자들 직업은 대학생에서부터 대기업 직장인, 심지어 군인, 공무원까지 다양하다. 최악의 경우 회사 정보는 물론 정부나 군 기밀까지 유출될 가능성도 배제하기 어려운 이유다.

피해 사례도 쏟아진다. 카톡 유출 사실을 알게된 한 예비 부부는 결혼이 무산될 위기에 처했고, 피임을 실패해 임신중절한 이야기, 성추행 피해 고민상담 카톡까지도 회사 측에 넘어갔다. 이 일로 정신과 진료를 받은 경우도 있다.


김진주씨(가명·30)는 2016년 연애의과학 앱이 출시됐을때부터 카톡 분석 서비스를 애용해왔다. 분석은 9번을 의뢰했다. 김씨는 "좋아하는 연인의 마음을 알고 싶어 시작했다"며 "다른 곳에 쓰일걸 알았다면 절대 서비스를 안썼을 거다. 내 돈내고 내 정보를 파는 격인데 왜 하겠나"라고 말했다.

카톡 유출 논란을 언론 보도로 접한 후 그는 하루 3시간도 깊게 자지 못할 정도로 불안감에 시달리고 있다. '카톡이 더 유출된 건 없을까'라는 걱정에 디씨인사이드 같은 커뮤니티를 수시로 확인한다. 외부 연락을 끊은지도 오래다.

부부간 대화는 물론 자녀의 정보까지 유출된 경우도 있다. 이경진씨(가명·34)는 "남편이 아이를 데려가기 위해 어린이집 주소를 보내달라고 한 적이 있는데, 그 내용도 넘어갔다"며 "동·번지까지 그대로 노출됐고, 우리 가족 생활반경도 다 적혀있다"고 털어놨다.



추가 유출 우려도…이루다 개발사 "개인 특정 가능한 정보 유출된 적 없다"




추가 유출 우려도 나온다. 스캐터랩이 오픈소스 플랫폼 '깃허브'에 카톡 대화 데이터로 학습하는 인공신경망 모델 파일을 올렸는데, 이 중에는 익명화를 안 한 개인정보가 다수 있었다. 현재 이 파일은 삭제된 상태다.

IT 업계 관계자는 "해당 파일은 간단한 프로그래밍만으로도 대화 내역을 볼 수 있다"며 "한 회사가 이미 퍼진 파일까지 삭제하기는 현실적으로 어렵다"고 지적했다. 이루다 카톡 유출 피해자들은 집단소송을 준비 중이다.

스캐터랩은 가명 처리가 부실했다는 지적은 일부 인정했지만, 이루다 데이터베이스의 정보를 조합해 한 개인을 특정하는 것은 불가능하다는 입장이다.

회사 측은 이날 새벽 이메일을 통해 "신규 AI 서비스 ‘이루다’를 개발하면서 연애의과학 서비스에서 수집한 메시지를 데이터로 활용한 바 있다"며 "이용자들과 충분히 소통하지 못하여 서비스를 아껴주신 이용자 여러분께 심려를 끼쳐드리게 되어 진심으로 머리숙여 사과드린다"고 밝혔다.

이어 "'이루다' 개발 과정에서 연애의과학 서비스 데이터 중 이용자의 닉네임, 이름, 이메일 등의 구체적인 개인 정보를 제거하는 등 비식별화 및 익명성 조치를 실시하였기에 개인을 특정할 수 있는 정보는 유출 내지 외부에 제공된 점이 없다"고 강조했다.

베스트 클릭

  1. 1 "건드리면 고소"…잡동사니로 주차 자리맡은 얌체 입주민
  2. 2 [단독]음주운전 걸린 평검사, 2주 뒤 또 적발…총장 "금주령" 칼 뺐다
  3. 3 "나랑 안 닮았어" 아이 분유 먹이던 남편의 촉…혼인 취소한 충격 사연
  4. 4 "역시 싸고 좋아" 중국산으로 부활한 쏘나타…출시하자마자 판매 '쑥'
  5. 5 "파리 반값, 화장품 너무 싸"…중국인 북적대던 명동, 확 달라졌다[르포]