"저작권 문제없이 AI 모델 고도화"…셀렉트스타, 학습 데이터 총판

머니투데이 최태범 기자 | 2023.11.30 11:00
[이 기사에 나온 스타트업에 대한 보다 다양한 기업정보는 유니콘팩토리 빅데이터 플랫폼 '데이터랩'에서 볼 수 있습니다.]

인공지능(AI) 학습 데이터 플랫폼 기업 셀렉트스타가 AI 학습 데이터 총판 사업을 본격화한다고 30일 밝혔다.

현재 AI 시장은 대규모 언어 모델(LLM) 등장과 함께 저작권 걱정 없는 대규모 학습 데이터에 대한 수요가 큰 상황이다. AI 도입을 위한 기술 장벽이 낮아지면서 서비스 개발을 위한 고품질 데이터가 더욱 중요해졌다.

셀렉트스타는 데이터 저작권자와 협의를 거쳐 도서, 이미지, 영상, 대화 등 고품질 데이터를 AI 기업에 유통·판매한다.

공개된 데이터셋 카탈로그에는 △법률 생활 금융 건강 등 전문가 질의응답 △전문 분야 도서 △글로벌 이미지 플랫폼 제휴 사진·일러스트·영상 △다국어 일상 대화 및 번역 데이터셋 △언리얼 엔진 기반 합성 데이터 등이 포함돼 있다.


카탈로그 대부분이 일반 데이터라벨러를 통해 구축할 수 없거나 저작권 문제로 확보하기 어려운 데이터셋 구성이다. 셀렉트스타는 구매 기업 요청에 따라 데이터를 가공하는 서비스를 별도로 제공한다.

황민영 셀렉트스타 부대표는 "핵심은 '인간의 의도'가 담긴 데이터"라며 "데이터 총판 사업으로 AI 기업이 확보하기 어려운 고품질 데이터를 제공해 AI 모델 성능 향상에 기여할 것"이라고 말했다.

[머니투데이 스타트업 미디어 플랫폼 '유니콘팩토리']

이 기사의 관련기사

베스트 클릭

  1. 1 "임신한 딸이 계단 청소를?"…머리채 잡은 장모 고소한 사위
  2. 2 [단독]유승준 '또' 한국행 거부 당했다…"대법서 두차례나 승소했는데"
  3. 3 "대한민국이 날 버렸어" 홍명보의 말…안정환 과거 '일침' 재조명
  4. 4 '청춘의 꿈' 부른 김용만, 자택서 별세…"한달전 아내도 떠나보내"
  5. 5 "봉하마을 뒷산 절벽서 뛰어내려"…중학교 시험지 예문 논란