LLM은 많은 양의 텍스트 데이터를 학습해 자연어처리(NLP)의 다양한 과제를 수행할 수 있는 생성AI 대표 모델이다. 최근에는 오픈AI의 챗GPT, 구글의 바드, 메타의 라마 등 글로벌 빅테크 기업의 대표 모델들이 뜨거운 경쟁을 벌이고 있다. 1000억개 매개변수(100B) 이하의 오픈 LLM들의 경쟁도 허깅페이스의 리더보드를 통해 시간 단위로 치열하게 이뤄지고 있다.
업스테이지의 모델은 비교적 작은 모델 사이즈에도 생성AI의 가장 큰 문제점 중 하나인 환각현상 방지 지표에서는 56.5점을 기록, 메타의 최신 '라마2' 모델(52.8점)을 앞질렀다. 이 모델은 라마2를 제외한 메타, MS 등 빅테크 기업이 만든 모델 대비 평균 10% 가량 높은 성적으로 2위를 기록했다.
특히 업스테이지는 자체 모델 구축에 나선지 약 두 달 만에 고성능의 AI 모델을 만든 것으로 알려졌다. 업스테이지는 최초의 한국어 자연어이해(NLU) 평가 데이터셋인 '클루(KLUE)'를 직접 구축한 것은 물론, 생성AI 서비스 AskUp을 직접 운영하며 쌓은 국내 최고의 프롬프트 엔지니어링 및 파인튜닝 노하우를 바탕으로 이번 오픈 LLM 모델을 개발했다.
이 시각 인기 뉴스
업스테이지는 추가적으로 국내 다양한 산업의 기업들의 요구에 부응하고자 한국어 성능을 높이기 위해 한국어 데이터를 추가 학습시킬 예정이다.
김성훈 업스테이지 대표는 "업스테이지의 AI 기술력이 지금 가장 치열한 경쟁을 벌이고 있는 생성AI 글로벌 톱 플랫폼의 평가에서도 세계 최고의 성과를 거둬 무척 기쁘다"며 "이번에 입증된 업스테이지의 기술력을 바탕으로 국내 기업은 물론 전세계 모든 기업들이 AI를 편리하게 사용할 수 있도록 노력할 것"이라고 말했다.
[머니투데이 스타트업 미디어 플랫폼 '유니콘팩토리']