'ㅅH刀IOF'도 잡아낸다…악플戰 AI 투입

머니투데이 백지수 기자 2020.07.25 07:00
글자크기
/사진=임종철 디자인기자/사진=임종철 디자인기자


악플(악성 댓글)과의 전쟁에 사람 대신 인공지능(AI)이 투입되고 있다. 문맥을 파악해 신종 악플과 특수기호 욕까지 걸러낼 정도로 AI 탐지 기술이 갈수록 정교해지고 있다.

악플과의 전쟁은 인터넷 기업들의 오랜 숙제였다. 표현의 자유와 인권 침해 사이에서 미묘하게 줄타기하는 게시글을 관리자가 일일이 모니터링 하기란 사실상 불가능하다. 금칙어 사전을 만들어 비속어들을 차단하는 경우는 있지만, 각 어휘의 변칙어까지 찾아낸다는 건 녹록치 않다. 자음과 모음을 결합하고 소리가 비슷하면 의미가 통하기도 하는 한국어 특성상 한 욕설의 변칙어만 10만개 이상으로 알려져 있기 때문이다. 가령 ‘XX년’ 같은 설을 걸러내기 위해 ‘년’을 금칙어 사전에 넣으면 ‘2020년’ 같은 말까지 차단하기 때문에 비효율적이다.



그러나 최근 AI 탐지기술이 정교해면서 이같은 비속어들을 쉽게 걸러낼 수 있다고 한다. 20여년 동안 인터넷 공간에 쌓인 비속어들이 빅데이터화 됐기 때문에 가능하다. 여기에 머신러닝(기계학습)을 통한 자연어 처리 기술을 활용해 비속어 변형 형태까지 90% 이상 정확하게 탐지할 수 있다는 설명이다.

서비스 악플 관리에 AI 기술을 활용하는 대표 기업은 네이버와 넥슨이다. 네이버는 지난해 4월부터 뉴스 댓글 서비스 관리에 AI 알고리즘 ‘AI 클린봇’을 적용해왔다. 욕설이나 비속어가 들어간 댓글을 자동으로 찾아내 블라인드 처리한다. 올해 6월엔 비속어를 포함하지 않아도 모욕적 표현과 무례한 댓글까지 잡아내도록 성능을 업그레이드 했다. 우리말 어휘를 음절 단위로 나눠 오탈자가 많은 구어체 댓글을 분석한 결과에 시각적 이미지 분석, 자연어 처리에 응용되는 머신러닝 기법, 문맥 연관성을 분석하는 양방향 장단기기억기술(LSTM) 등이 동원됐다는 설명이다. 그동안 이용자들이 차단당할 것을 우려해 특수문자나 이모티콘을 사용해 우회적으로 욕하는 경우나 비속어 없이 문맥상 상대방을 모욕한 문장까지 걸러낼 수 있었던 것도 이들 기술 덕분이다.



예컨대 ‘개XX야(개의 어린 자식아)’라는 욕설을 강아지 이모티콘과 새 이모티콘을 합치거나 ‘ㅅH㉪IOF’처럼 복잡한 이모티콘으로 표현해도 AI가 쉽게 걸러낼 수 있다. 전라도민을 비하하는 ‘홍어’처럼 원래 비속어가 아니지만 비속어로 쓰이게 된 말도 AI가 걸러낼 수 있다. 네이버 관계자는 “AI클린봇 탐지 정확도가 95%에 달한다”며 “특히 클린봇 업그레이드 직전과 비교해 악성 댓글 신고 건수가 19% 나 감소했다”고 밝혔다.
넥슨 인텔리전스랩스의 텍스트 탐지 기술이 잡아낼 수 있는 악플의 예 /사진=넥슨코리아넥슨 인텔리전스랩스의 텍스트 탐지 기술이 잡아낼 수 있는 악플의 예 /사진=넥슨코리아
넥슨도 2018년부터 게임 내 채팅에 딥러닝 기반의 AI 텍스트 탐지 기능을 적용하고 있다. 이 회사가 개발한 텍스트 탐지 기술은 넥슨의 AI 연구조직 ‘인텔리전스랩스’가 개발한 기술이다. 욕설, 혐오 표현, 도박 광고 등을 실시간 차단한다. 최근에는 온갖 한자와 일본어의 히라가나·가타카나, 러시아어의 키릴 문자 등의 특수기호까지 활용해도 잡아낼 수 있을 정도로 탐지 수준이 높아졌다고 한다. 넥슨은 현재 이 알고리즘을 욕설 뿐만 아니라 현금거래 광고 등의 탐지에도 활용해 특정 현금 거래 사이트 주소 차단 등에도 이용하고 있다는 설명이다.

넥슨 관계자는 “악플이 계속 진화하는 만큼 악플 탐지 알고리즘도 계속 진화하게 될 것”이라고 밝혔다.

TOP