3월 22일 서울 중구 KISTEP 서울평가회의장에서 만난 정병선 원장이 KISTEP이 개발한 AI 서비스에 대해 설명하고 있다. /사진=KISTEP
최근 서울 중구 KISTEP 서울평가회의장에서 만난 정병선 KISTEP 원장은 "누구나 생성형 AI를 쉽게 쓸 수 있는 시대지만 생성형 AI를 도입한 공공기관은 아직 많지 않다"며 "국가적 인사이트를 제시하는 기관인 KISTEP이 먼저 시범에 나설 것"이라고 말했다. 그는 오픈소스를 활용, 직접 구축 중인 KISTEP AI모델을 하나하나 시연했다.
KISTEP이 개발한 KISTEP 특화언어모델 기반 지능형 검색 화면. 원하는 연구 주제를 입력하면 2010년~2021년 발표된 연구과제 중 주제와 관련된 연구 과제만 골라 보여준다. /사진=KISTEP
KISTEP은 방대한 정부 R&D과제 정보를 한데 모아 AI에 검색, 분류, 분석, 문서요약, 통계까지 작성토록 하는 'KISTEP DAPT(Domain Adaptive Pretrained·도메인 적응 추가 사전학습) 모델'을 개발 중이다. 이 역시 개발코드 공개 웹사이트 '깃허브'(GitHub) 등에 공개된 코드를 활용했다. 광범위한 과학기술계 R&D의 현황과 동향을 분석하는 KISTEP의 미션에 생성형 AI를 활용해 속도감과 효율성을 부여한다는 계획이다.
KISTEP이 2023년 '민간 첨단 초거대 인공지능 활용지원 사업(NIA)'의 일환으로 바이브컴퍼니(VAIV)의 인프라를 활용해 구축한 자체 GPT 시범 장면. KISTEP 내부 자료를 기반으로 질문에 대한 답을 내놓는다. /사진=KISTEP
-챗GPT 등 거대 생성형 AI가 있음에도 국내 서비스를 자체개발해야 하는 이유는.
▶'똑똑한 만물박사'와 '좁지만 깊은 전문가'의 차이라고 볼 수 있다. 말 잘하고 이것저것 아는 인물도 필요하지만 특정분야의 진짜 전문가도 필요하다. 특히 급변하는 환경에서 요구에 맞는 도움을 받으려면 '깊음'이 더 중요하다고 본다. 우리만의 과학정책 전문 GPT를 개발해야 하는 이유이기도 하다. 보안과 정확성 문제도 있다. AI에서 '뇌'를 담당하는 게 LLM(거대언어모델)이다. 오픈AI의 챗GPT나 구글 제미나이에 국가 전략기술과 관련한 질문을 하면 이들의 LLM에 해당 질문과 관련한 데이터가 쌓인다. 이는 정보보안에 문제가 생길 수 있다는 얘기다. '할루시네이션'(Hallucination·조작된 정보생성)의 위험도 크다. 포괄적 데이터를 학습한 LLM이 맥락과 다른 허위정보를 생성해 '그럴듯한 답변'을 내놓는 건데 정확한 지식과 분석이 필요한 정책기관은 이를 활용할 수 없다.
이 시각 인기 뉴스
-KISTEP이 먼저 자체 생성형 AI 개발에 나섰는데.
▶생성형 AI를 누구나 쉽게 쓸 수 있는 시대가 왔다. 지금까지는 AI를 이용하는 공공기관이 많지 않았는데 정책에도 생성형 AI를 이용할 단계가 됐다고 본다. 국가정책이 점점 복잡해지면서 데이터양도 기하급수적으로 늘어나 정책을 분석하는데 시간이 너무 많이 들기 때문이다. 특히 KISTEP은 국가 R&D 조사·분석, 평가를 도맡아 보유 정보량이 많다. 분석의 질을 높이면서도 업무효율성을 높이려면 AI 도입이 필요하다고 봤다. 실제 내부에서 시범적으로 개발해본 결과 통상 1주일 걸린 업무를 1시간이면 끝낼 수 있었다.
-원장이 직접 나서 코딩부터 한다던데.
▶군대에 있을 때부터 코딩을 배웠으니 코딩에 대한 관심은 꽤 오래됐다. 깃허브(GitHub)와 허깅페이스(Hugging Face) 등 개발자 플랫폼에 공개된 프로그래밍 코드와 LLM을 가져와 조금만 손보면 우리만의 모델을 만들 수 있다. 연구원 내부에 AI를 다루는 직원이 별로 없어 외부용역을 활용해왔는데 이 구조로는 업무의 지속성이 떨어진다고 판단, 올해부터는 AI 전환 TF(태스크포스)를 꾸려 현재 15명의 직원이 근무 중이다.
-실제 구현된 사례가 있나.
▶현재 KISTEP 내부망을 통해 직원들이 이용할 수 있는 TF 홈페이지를 시범적으로 운영 중이다. 'h2o GPT'라는 오픈소스 GPT를 활용했다. 예컨대 '글로벌 R&D 협력의 우리나라 현황과 한계는'이라는 질문을 던지면 30초~1분 안에 내부 DB(데이터베이스)를 기반으로 정보를 찾아준다. 목차를 지정할 수도 있다. '정책대안을 다음 목차로 작성해주세요. 배경 및 필요성, 글로벌 동향, 정책대안 등'이라고 지시하면 이에 맞게 목차를 나눠 답변한다. 아직은 개발단계여서 한글이 아닌 영어로만 답변하는 한계가 있는데 최근 출시된 한국어 특화 LLM '구름3'를 적용하면 한국어 답변도 가능할 것으로 기대한다.
'h2o GPT' 기반으로 만든 KISTEP GPT 화면. 정 원장이 '글로벌 R&D 협력의 우리나라 현황과 한계는?'이라는 질문을 입력하자 목차에 맞춰 답변을 내놓았다. /사진=박건희 기자
▶오픈소스를 활용해 지금까지 약 20개 검색·분석·요약서비스를 내부적으로 도입했는데 올해 말까지 전 직원이 자유롭게 AI를 쓸 수 있도록 하는 게 목표다. 오픈소스를 활용하는 방법을 배우기만 한다면 직원들도 활용목적에 맞게 스스로 '맞춤형 AI'를 개발할 수 있을 것이다. AI는 인간의 노동력을 대체하는 게 아니라 인간의 능력을 증강하는 도구다. 신체능력이 남보다 증강된 영웅 캐릭터가 '슈퍼맨'이라면 AI는 인간의 지성을 높이다. 이처럼 지성적인 분석력을 높이는 툴을 누구나 한두 개 보유해 활용한다면 지금보다 업무효율이 훨씬 올라갈 것으로 본다.
-KISTEP의 비전을 한마디로 정의한다면.
▶'누구나 AI, 무엇이든 AI, 어디서나 AI'다. 모두 자유자재로 AI를 활용해 지금보다 훨씬 효율적으로 일하는 환경을 구축하는 것이다.