여고생 딸 '임신' 엄마보다 마트가 먼저안다?

유병철 기자 2013.05.19 09:18
글자크기

빅데이터가 '돈'이다… 빅데이터 활용, 프라이버시 침해 '우려'

22


개인정보 유출 이어 사생활 감시 가능성도 우려

수많은 정보의 바다에서 데이터를 수집해 새로운 가치를 창출해내는 '빅 데이터 프로세싱'(Big Data Processing, 이하 빅데이터)이 최근 각광받고 있지만 그만큼 부정적인 면도 없지 않다.

가장 큰 문제는 빅데이터가 사람들의 생활패턴 등을 계량화하는 것이다 보니 필연적으로 개인의 프라이버시를 침해할 수 있다는 점이다. 옥션, 네이트, 소니 등 다양한 기업에서 개인정보 유출사고가 발생했고 이로 인해 개인정보 보호에 대한 사회적 관심은 높아지고 있지만 여전히 인터넷 상에는 수많은 주민등록번호와 개인정보가 떠다닌다.



지난 8일 한국인터넷진흥원(KISA) 산하 개인정보분쟁조정위원회가 발표한 '2012년도 개인정보분쟁조정사례집'을 보면 지난해 접수된 분쟁사건은 총 143건으로 전년의 126건보다 13.5% 늘었다. 조정 신청이 가장 많은 유형은 '목적 외 이용 및 제3자 제공'으로 전체의 53%(76건)를 차지했다. 이는 개인 전화번호나 이메일을 주인 동의 없이 홍보 목적으로 이용하거나 보험사와 같은 제휴업체에 제공한 것인데 전년에는 19건에 그쳤다.

한국인터넷진흥원은 전체적으로 분쟁사건의 접수가 늘어난 것은 지난 2011년 9월 개인정보보호법이 시행되고 난 후 개인정보보호에 대한 인식수준이 높아진 결과로 분석했다.



빅데이터가 가져올 아름다운 미래에 대해서는 다양한 분석이 나오고 있다. 하지만 정작 가장 중요한 개인 프라이버시 보호에 대해서는 충분한 논의가 이뤄지지 않아 문제점으로 지적되고 있다.

◆ 부모보다 먼저 임신사실 알게 된 할인매장

지난해 미국 할인매장업계 2위인 '타겟'(Target)의 빅데이터 활용 마케팅 사례는 충격적이었다. 타겟은 지난 2012년 고객으로부터 거센 항의를 받았다. 타겟이 고등학생인 딸에게 유아용품 할인쿠폰을 보냈기 때문이다. 당시 타겟의 매니저는 "예비엄마에게 보내야 할 쿠폰을 잘못 보냈다"며 사과했다.


타겟이 고등학생에게 유아용품 할인쿠폰을 보낸 것은 빅데이터를 활용했기 때문이다. 여성이 임신하면 초기에는 영양제, 중기에는 로션, 말기에는 유아용품을 주로 구매한다는 통계분석 결과가 바탕이 됐다. 여고생이 영양제를 구입한 후 얼마 지나지 않아 로션을 구매하자 타겟 측은 출산시점이 머지않았다는 판단 아래 유아용품 할인쿠폰을 보낸 것이다.

해프닝으로 끝날 것 같았던 이 일화는 한달 뒤 반전됐다. 알고 보니 이 여고생이 진짜로 임신 중이었던 것이다. 부모조차 몰랐던 딸의 임신사실을 유통업체가 빅데이터를 기반으로 한 구매행태분석 기반의 예측시스템을 통해 '먼저' 알았던 것이다.

여고생 딸 '임신' 엄마보다 마트가 먼저안다?
◆ '성향'마저도 찾아서 보여주는 페이스북

이미 일상으로 자리 잡은 소셜네트워킹서비스(SNS)인 페이스북의 경우 내밀한 성향까지도 빅데이터에 의해 분석되고 있음을 알게 했다. 페이스북 화면 오른편에 뜨는 '알 수도 있는 사람'이 바로 페이스북이 빅데이터를 이용하고 있음을 보여준다. 그러나 페이스북은 여기서 한발 더 나아가 숨기고 싶은 성향조차도 분석해 '맞춤형 서비스'를 제공하고 있다.

자신이 '게이'임을 숨기며 살고 있는 맷의 사례는 인터넷 기사에 댓글 하나 쓰는 것조차 조심해야 한다는 경고로 다가온다. 지난 3월 맷은 아주 친한 친구에게 '커밍아웃'에 대한 조언을 듣고자 페이스북을 통해 메시지를 보냈다. 그랬더니 자신의 페이스북에 '커밍아웃? 도움이 필요하세요?'라는 '스폰서 스토리'가 떴다.

페이스북은 전화나 휴대폰 메시지가 아니라 '댓글'을 분석해 맷이 동성애자임을 분석해냈다. 많은 웹사이트들이 댓글 활성화를 위해 댓글을 페이스북과 연동되도록 해놨는데 이 댓글 분석을 통해 성향을 알아낸 것이다.

맷의 경우 '롭 포트만 오하이오 상원의원이 동성결혼 지지를 발표했다'는 '버즈피드'(이슈영상과 사진, 뉴스기사 등을 올리는 커뮤니티)의 기사에 댓글 2개를 단 것으로 알려졌다.

◆ 내 개인정보, 문제는 없을까

빅데이터를 활용할 때 가장 간과해서는 안되는 부분이 바로 개인정보와 프라이버시 노출 문제다. 빅데이터를 활용해 다양한 분석을 하게 되면 필연적으로 기존에 알 수 없었던 사용자 개개인에 대한 성향이 분석된다. 기업 입장에서는 마케팅 대상이 세분화되므로 개개인에 특화된 맞춤형 서비스를 제공할 수 있다.

그러나 뒤집어 말하면 이전에 자주 유출의 대상이 됐던 주민등록번호나 휴대전화번호, 인터넷 아이디 등에서 더 나아가 카드 이용내역, 병원 이용현황, 어디서 어디로 이동했는가와 같은 활동내역 등이 유출될 우려가 있다. 당연하지만 이러한 정보가 오남용될 경우 지금까지와는 달리 매우 '치명적'인 문제가 발생할 수 있다.

특히 국내에서는 개인을 식별할 수 있는 주민등록번호의 음성적 거래가 만연해 있다는 사실도 염두에 둘 필요가 있다. 자칫 조지 오웰의 소설 <1984>처럼 정부나 기업이 국민을 감시할 수 있는 사회로 전향되거나 이에 따른 국민의 기본권 후퇴로 이어질 수 있다는 점이 빅데이터 활용의 어두운 면이다.

물론 이에 대해 범 정부차원의 노력이 진행되고 있기는 하다. 정부는 지난해 11월 발표한 '빅데이터 마스터플랜'에서 빅데이터 법안 개정 및 개인정보 보호대책 마련에 대한 연구사업을 언급했다. 그리고 안전행정부는 지난 3월부터 비공개로 민간전문가와 함께 '개인정보 개선 TF팀'을 만들어 법안 검토작업을 진행 중인 것으로 전해진다.

다만 아직까지는 이러한 법안이 어떠한 방향으로 흘러갈지 짚어내기가 쉽지 않다.

과거에 흘려보내던 정보를 집대성해 유의미한 결과를 도출해내는 '빅데이터'의 특성상 어디서 어떻게 사생활 침해가 일어날지 미리 예상하기 어려워서다.

정영수 한국정보화진흥원 선임연구원은 "폭넓은 활용을 토대로 문제 진단 및 해결방안을 마련해야 하는 빅데이터 처리 속성상 분석목적을 한정하고 동의를 획득하는 것이 곤란하다"며 "또한 사전에 분석결과를 어떤 식으로 활용할지에 대한 예측도 어렵다"고 우려했다.

이어 "데이터를 분석하기 쉬운 형태로 일목요연하게 정리함으로써 사생활 침해 우려가 커졌다"며 "다양한 매체 및 데이터 분석을 통해 정보 제공자가 의도하지 않은 사생활 침해가 가능하다"고 설명했다.

예컨대 별 생각 없이 페이스북이나 트위터에 올린 자료들을 통합해 혼자 살고 집이 비는 시간 등을 파악할 수 있고, 이를 범죄에 악용할 가능성도 충분히 있다는 것이다.

정 선임연구원은 "개인의 프라이버시와 관련된 기업의 정보유출 방지의무가 없어 불특정 다수가 무단으로 이용하는 걸 방지하려는 노력이 소홀할 수 있다"며 "사생활 기록을 장기간 보관하는 데 따른 사생활 감시 가능성도 발생할 수 있다"고 경고했다.

☞ 본 기사는 <머니위크>(www.moneyweek.co.kr) 제280호에 실린 기사입니다.
TOP