허깅페이스가 운영하는 오픈LLM 리더보드의 기존 데이터를 단순히 번역한 것이 아니라 한국어의 특성과 문화를 반영한 고품질의 데이터를 자체 구축해 한국어 특화 리더보드로서의 강점을 갖췄다.
즉 상식생성 기준을 통해 국내에서 가장 대표적인 할루시네이션(환각 현상)의 예시로 평가되는 '세종대왕의 맥북던짐 사건' 등의 사례들도 방지할 수 있어 한국어와 역사에 대해 더 적합한 모델을 평가할 수 있다는 평가다.
이 시각 인기 뉴스
업스테이지 관계자는 "Open Ko-LLM 리더보드는 한국어 LLM 연구의 수준과 경쟁력을 높이고 한국어 데이터의 양과 질을 개선하며 한국어 LLM의 국제적 인지도를 제고할 것"이라고 했다.
Open Ko-LLM 리더보드 개설에는 KT와의 협업도 한몫했다. KT 클라우드의 인프라 지원을 통해 리더보드가 안정적으로 운영될 예정이다. 업스테이지는 한국 정서를 담는 고품질 LLM 개발을 넘어 이를 국내 LLM 독립을 위한 생태계 조성에 기여할 계획이다.
김성훈 업스테이지 대표는 "고품질 한국어 데이터 공유는 물론 리더보드를 통한 협업 촉진과 빠른 기술 전파 등으로 한국 AI 생태계를 넓히고 발전을 증진시킬 수 있도록 더욱 노력 할 것"이라고 말했다.
[머니투데이 스타트업 미디어 플랫폼 '유니콘팩토리']