데이터메이커, 데이터 라벨링 新강자

머니투데이 중기협력팀 박새롬 기자 2021.04.02 17:10
글자크기

데이터메이커 '데이터 바우처 지원사업 3개년 공급기업 선정'

데이터를 입맛에 맞게 가공하는 사람. '데이터 라벨러'다. 이들은 센서 데이터를 라벨링한다. 일례로 자율주행차가 사물을 잘 인식하도록 돕는다. 차의 눈이라 불리는 '라이다'(lidar) 센서로 수집한 데이터를 라벨링하는 것이다. 이미지 데이터도 마찬가지다. 도시철도 AI(인공지능) CCTV(폐쇄회로TV) 구축이 그 예다. 실제 CCTV 영상을 활용, 이상 행동 객체를 분류하고 추적한다. 사투리를 해석하는 오디오 데이터 라벨링까지 가능하다.

'데이터 라벨러'는 데이터메이커(대표 이에녹)의 자산이다. 회사는 국내(1만5000여명) 라벨러와 해외(3000여명)의 라벨러를 보유했다. 숙련된 인력을 활용해 '데이터 라벨링'의 전문성을 높였다. '데이터 라벨링'은 AI 개발사뿐 아니라 일반 기업에도 꼭 필요한 작업이다. AI가 고도화되면서 요구하는 데이터의 수준 역시 높아졌기 때문이다.



데이터메이커는 인력을 무기로 '데이터 라벨링' 분야에 집중하고 있다. 특히 '데이터 바우처' 지원사업에 주력한다는 방침이다. 수요가 커진 데이터 활용 시장을 선점한다는 목표다. 회사는 2019년 1차년도 '데이터 바우처'의 공급기업으로 선정됐다. 사전협약 수요기업 15곳의 선정률 100%를 기록하며 활약했다. 2021년엔 3년 연속 공급기업이라는 타이틀도 획득했다. 최다량의 고품질 데이터를 제공, 데이터바우처의 'NO.1' 공급기업이 되겠다는 목표다.

데이터메이커의 자신감은 '숫자'에 기반한다. 회사가 현재까지 라벨링한 객체 수는 1.5억개, 누적 라벨링 데이터량은 2000만개에 이른다. 매일 50만개 이상의 바운딩 박스, 1000시간 이상의 음성 전사도 처리할 수 있다. 회사 측은 "이제껏 도로 주행 영상을 라벨링한 거리는 지구 한바퀴를 돌고도 남는 5만㎞"라면서 "6000시간 분량의 STT(음성 문자 변환)도 축적했다"고 했다.



이 모든 게 회사 설립 3년여만에 이룬 성과다. 회사는 약 400개의 '데이터 라벨링' 프로젝트를 수행해왔다. △센서 데이터 라벨링 △이미지 데이터 라벨링 △오디오 데이터 라벨링 △텍스트 데이터 라벨링 등의 분야를 공략하고 있다. 다양한 영역의 '데이터 라벨링' 서비스를 제공, 대기업·지자체 등을 고객사로 보유하고 있다.

데이터메이커 측은 "AI 전처리 엔진과 라벨러 보유 역량을 기반으로 업계에서 가장 많은 데이터를 라벨링할 것"이라면서 "중소기업, 스타트업, 예비 창업자 등을 대상으로 최고의 데이터 가공 서비스를 제공하겠다"고 덧붙였다.

데이터메이커 로고/사진제공=데이터메이커데이터메이커 로고/사진제공=데이터메이커




TOP