그녀는 아마존의 크라우드 소싱 시스템을 활용, 일종의 이미지 은행을 만들었다. 세계 각국에서 5만 여명이 참여해 10억 장에 달하는 이미지를 분야별로 분류하고 이미지의 내용에 맞는 영어 단어를 붙이는 작업을 한 것. 이후 1500만장에 달하는 이미지 데이터베이스를 구축, 누구나 쉽게 활용할 수 있도록 무료로 공개했다.
이 때문에 페이페이 리는 ‘논문을 쓸 수 있는 연구를 하라’거나 ‘무모한 프로젝트’라는 주위의 걱정에도 아랑곳 하지 않고 이 사업을 꾸준히 진행했다.
기업들도 그동안 서비스를 제공하고 제품이나 서비스를 생산, 유통, 판매하는 과정에서 축적한 데이터가 기업의 핵심 자산이라는 점을 인식하기 시작했다. 아마존은 싼 값에 제품을 파는 대신 거래를 통해 축적한 고객의 데이터를 기반으로 새로운 시장에 뛰어들고 신규 서비스를 내놓고 있다. 다른 기업들 역시 서비스나 상품판매를 통해 얻은 데이터를 활용하는 데 관심이 많다. 스마트 스피커 등 다양한 디바이스를 통해 데이터 수집 채널을 확대하려는 노력도 활발하다.
민간뿐만 아니라 정부나 의료기관, 사회단체 등에서도 데이터를 활용해 기존 서비스의 수준을 높이거나 혁신적인 서비스를 만들려는 시도를 하고 있다. 통신과 교통 데이터를 바탕으로 감염병 확산의 경로를 예측하는 가하면 사람들의 유전자를 분석, 개인에게 딱 맞는 치료법을 제시하기도 한다. 전력소비량을 줄이거나 우범지역 감시를 효율화하는 데도 데이터가 큰 역할을 한다. 이 때문에 전문가들은 데이터를 ‘미래의 원유’, ‘새로운 산업의 쌀’이라고까지 부르고 있다.
이 시각 인기 뉴스
문제는 우리가 갖고 있는 데이터가 대부분 당장 쓸 수 없는 형태로 수집, 보관되고 있다는 점이다. 고객과의 상담내용을 분석, 더 효율적인 서비스를 제공하려는 시도를 했던 한 금융기업은 고민 끝에 결국 인공지능 기술 적용을 포기했다. 계약 상담을 진행한 수 만 시간 분량의 음성데이터가 있었지만 그 데이터가 어떤 내용인지 제대로 정리돼 있지 않거나 상담후 어떤 고객반응이 있었는지, 어떤 조치를 했는지를 알 수 없었기 때문.
우리에게 지금 각 분야나 조직에 페이페이 리 존재가 필요한 상황이다. 하지만 모든 사람들에게 그녀 같은 헌신을 기대할 수는 없다. 당장 페이페이 리 같은 존재를 만들 수 없다면 적절한 보상을 제공, 시장이 그 역할을 하도록 해야 한다. 데이터의 가치를 인식한다면 좋은 데이터를 만드는 역할의 중요성을 인식하고 이에 대한 적절한 보상을 해 줘야 한다. 좋은 데이터가 많아져야 인공지능 기술육성도 빅데이터 활용도 가능해진다.
장윤옥 테크M 편집장