"챗GPT? 한국어엔 약해"…속도전 밀린 네·카오 돌파구는

머니투데이 이정현 기자, 배한님 기자, 최태범 기자 2023.03.23 09:30
글자크기

[MT리포트]생성AI 대전 2라운드(下)

편집자주 오픈AI의 챗GPT에 이어 GPT-4 발표이후 글로벌 빅테크간 생성 AI 개발 속도전이 점입가경이다. 특히 생성 AI를 기존 사무용 SW(소프트웨어), IT서비스와 결합해 업무혁신과 생산성을 제고하려는 시도가 전방위적이다. 프롬프트 엔지니어나 CAIO(최고AI책임자)등 전에 없던 직업군과 AI결합 서비스도 속속 생겨나고 있다. 최근 AI를 둘러싼 빅테크의 속도전 여파와 이에 따른 변화상을 짚어본다.

AI 기술 격차 커질까…구글·MS 속도내는데 네카오는 '잰걸음'
④ 네카오, 올 상반기 생성 AI 상용화 '박차'

"챗GPT? 한국어엔 약해"…속도전 밀린 네·카오 돌파구는


글로벌 빅테크의 생성 AI 대전에 발맞춰 네이버(NAVER (181,500원 ▼1,200 -0.66%)카카오 (47,300원 ▼100 -0.21%) 등 국내 기업들도 국내에 최적화된 생성 AI를 만들기 위해 고군분투 중이다. 다만 외국 AI 기술 발전에 비해 상용화 속도가 느려 자칫 세계시장에서 뒤처질 수 있다는 우려가 나온다.



22일 관련업계에 따르면, 네이버는 생성 AI 기반이 되는 거대 언어모델(LLM) '하이퍼클로바X'를 오는 7월 출시할 예정이다. 챗GPT가 한국어에 약하다는 점을 노려 챗GPT보다 한국어를 6500배 더 많이 학습시켰다. 여기에 검색에 특화한 '서치GPT'도 공개한다. 네이버가 오랜 기간 쌓아온 검색 데이터를 활용해 한국인에 최적화된 생성 AI 서비스를 제공하겠다는 취지다.

카카오도 지난 7일 전문 일러스트레이터를 위한 이미지 생성 AI 서비스인 'B^ EDIT'(비 에디트)를 공개했다. 올 상반기엔 GPT-3 한국어 특화 모델인 KoGPT를 GPT-3.5버전으로 고도화할 계획이다. AI 화가 '칼로'의 한국어 버전과 AI 기반 이미지 생성·공유 플랫폼 'B^ DISCOVER'(비 디스커버)를 활용한 프로필 생성 앱도 출시할 예정이다.



LG (78,900원 ▲1,000 +1.28%)는 초거대 멀티모달(문자 뿐 아니라 음성·사진·영상 등 복합적인 정보를 처리) AI 모델인 'EXAONE'(엑사원)을 이용한 전문가 AI를 오는 7월 중으로 선보일 예정이다. 전문가 AI는 전문 문헌으로 학습한 내용을 기반으로 답변하고 출처를 표기해 전문성과 신뢰성을 높였다. LG는 자체 AI 모델을 자사 전자제품 등에 적용해 나갈 방침이다.

한글과컴퓨터 (24,050원 ▼950 -3.80%)는 한컴오피스에서 제공하는 챗봇, 번역 등 AI 관련 기능에 생성 AI 기술을 접목할 계획이다. 한컴오피스의 클라우드 기반 SaaS(서비스 소프트웨어)인 한컴독스에도 챗GPT를 적용해 고도화한다. 기업간 합종연횡도 시작됐다. SK C&C와 네이버클라우드는 양해각서(MOU)를 맺고 각각 IT 서비스 역량과 네이버 하이퍼클로바X를 결합해 국내 산업 맞춤형 초대규모 AI 서비스 발굴에 나선다.

◇韓 이제 상용화 걸음마인데‥AI 진화속도 빨라졌다


"챗GPT? 한국어엔 약해"…속도전 밀린 네·카오 돌파구는
이같은 노력에도 국내 기업의 상황은 낙관적이지 않다. "무어의 법칙을 능가한다"는 말이 나올 정도로 AI 발전속도가 빨라서다. 오픈AI는 지난해 11월 말 LLM인 GPT-3.5를 공개한 지 4개월도 지나지 않아 인간 수준의 GPT-4를 발표했다. GPT-3(2020년 6월 출시)에서 GPT-3.5로 가는데 2년이 넘게 걸린 것 대비 진화 속도를 한층 단축했다.

국내 기업들이 생성형 AI 서비스 출시를 위해 잰걸음을 하고 있지만 상용화는 더욱 요원해 보인다. 카카오가 지난 19일 공개한 카카오톡 기반의 AI 챗봇 서비스 '다다음'(ddmm)이 시행착오 끝에 하루 만에 재정비에 들어간 게 대표적이다. 업계에선 "완성도가 낮은 상황에서 성급하게 공개했다"는 말이 나온다.

네이버도 상품명 교정, 리뷰 요약 등 자체 서비스에 하이퍼클로바를 적용했지만 챗GPT처럼 일반인이 체감하긴 어렵다. 한 AI 전문가는 "네이버는 파라미터 2040억개의 하이퍼클로바를 구축하기 위해 1000억원을 투자했는데, 파라미터 1750억개의 GPT-3.5 성능이 훨씬 좋다"라며 "거대 AI 모델을 운영하는 비용이 막대해 고민이 많은 것으로 안다"고 귀띔했다.

장병탁 서울대학교 AI 연구원장은 "국내에서도 초거대 AI 연구를 늦게 시작한 건 아니지만 보수적인 분위기와 부족한 한글 데이터 등으로 제한된 부분이 있다"라며 "한국형 생성 AI 서비스가 나오면 세계 시장과 기술력 차이가 어느 정도인지 알 수 있을 것"이라고 말했다.

자체 LLM은 '돈 먹는 하마'…韓 현실 안맞아 vs 모델 사용료 생각해야
⑤ 韓, 방향성 고심…"글로벌 빅테크 무관심한 소수언어권 노려야"

/사진제공=이미지투데이/사진제공=이미지투데이
글로벌 빅테크 기업이 각축전을 벌이는 상황에서 오히려 한국은 다소 소외되는 분위기다. 한국은 전 세계서 3번째로 거대 언어모델(LLM)을 구축했지만 발전속도는 더디다는 비판이 줄을 는다. MS와 구글이 경쟁적으로 서비스를 내놓고 있지만, 네이버(NAVER (181,500원 ▼1,200 -0.66%)카카오 (47,300원 ▼100 -0.21%)로 대표되는 국내 빅테크는 여전히 대중이 체감할 수 있는 기술을 내놓지 못하고 있어서다.

이 때문에 천문학적 비용이 드는 LLM을 직접 구축하기보단 글로벌 빅테크의 모델의 '체크포인트'를 가져와 전문 AI 모델을 만들거나 API를 활용해 버티컬(특정 산업분야) 서비스를 내놓는 방안이 더 효율적이란 목소리가 나온다. GPT-4의 API를 활용하면 개발비 부담은 줄어드는데 GPT-4의 성능은 유지하면서 기업 특성에 맞는 서비스를 구현할 수 있어서다.

손병희 국민대 소프트웨어융합학부 교수는 "글로벌 빅테크 LLM의 체크포인트를 가져오면 백지 상태에서도 해당 모델의 학습능력을 이식할 수 있다"라며 "여기에 각 사가 보유한 데이터를 대입해 각 도메인(분야)에 특화된 전략으로 가면 발빠르게 대응할 수 있다"고 조언했다.

더욱이 GPT-4는 다국어 지원을 강화, 한국어 서비스가 3.5버전의 영어능력을 능가하는 것으로 나타났다.

AI업계 관계자는 "국내 AI 기술 수준이 낙후되진 않았으나, 인프라·컴퓨팅환경·데이터가 부족하다보니 환경적인 측면으로 빨리 성장하지 못했다"라며 "세계 시장에서 경쟁력을 갖기 위해선 카카오가 주장하는 것처럼 작지만 전문성을 갖춘 모델을 개발해 챗GPT가 커버하지 못하는 부분을 노리는 게 필요해 보인다"고 말했다.

◇"영어 중심 LLM 비싸, 한국어 전용 모델로 효율성↑"

반면, 글로벌 기술패권에서 살아남으려면 국산 LLM이 필요하다는 반론도 있다. 특히 소수언어를 쓰는 국가로선 영어 중심의 LLM이 비용면에서 비효율적이란 지적이다.

GPT토크나이저에 따르면 "오늘 저녁 메뉴는 스테이크지."라는 16개 문자(공백포함)로 구성된 문장을 GPT-3에서 처리하면 토큰 36개로 계산된다. 토큰이란 LLM 사용료를 측정하는 단위다. GPT-4에서도 21개 토큰이 필요하다. 반면 "Today's dinner menu is steak."라는 영어 문장은 29개 문자로 구성됐지만, GPT-3에서는 단 7개 토큰만 사용한다.

GPT-3.5 이용료는 1000토큰에 0.002달러(약 2.6원)였는데, GPT-4는 같은 양에 0.03달러(39.3원)로 직전 모델보다 약 15배 비싸졌다. 이처럼 생성 AI 사용료가 꾸준히 오르는 상황에서 영어 중심의 생성 AI는 한국처럼 비영어권 국가엔 다소 비싼 모델이다.

만약 "오늘 저녁 메뉴는 스테이크지."를 네이버 하이퍼클로바에서 처리할 경우 토큰 7개로 계산된다. 한국어 중심 LLM을 만들면 자음·모음처럼 작은 단위가 아니라 의미 단위로 토큰을 끊을 수 있어 경제적이라는 설명이다.

하정우 네이버 AI연구소장은 "오픈AI와 구글, 메타는 미국에서 영어로 경쟁하기에 바빠 다른 언어를 둘러볼 여유가 없다"며 "이때 우리는 한국어를 중심으로 한국어 LLM을 만들고, 비슷하게 일본어를 중심으로 만들어 일본에, 또 아랍어를 중심으로 만들어 중동 시장에 나가면 된다"고 설명했다.

초거대 AI 'GPT' 올라탄 K-스타트업, 더 큰 도약 가능할까
"챗GPT? 한국어엔 약해"…속도전 밀린 네·카오 돌파구는
'검색' 패러다임을 바꾸고 있는 챗GPT(ChatGPT)의 등장에 국내 스타트업들도 서비스 고도화와 사업 확대를 위해 초거대 AI 언어모델인 GPT 기술 접목에 적극 나서고 있다. 자체적으로 구축한 AI 기술에 GPT 모델과 챗GPT 기능을 더해 고객이 원하는 정보를 보다 정밀하게 찾아내고 맞춤형으로 제공하는 식이다.

22일 벤처·스타트업 업계에 따르면 국내 스타트업들은 주로 정보검색 능력을 강화하는데 GPT 기술을 접목하고 있다. 인터넷 형광펜 기반 정보 큐레이션 서비스를 운영하는 라이너는 GPT 등 언어모델을 결합한 '라이너 AI'를 출시하며 구글이 장악한 검색 시장에 도전장을 던졌다.

라이너 AI는 기본적인 검색 결과뿐만 아니라 하이라이트 기능을 통해 수천만명에 달하는 라이너 이용자들이 이미 검증한 빅데이터를 결합함으로써 개인에 맞는 정확한 추천 콘텐츠를 보여준다.

라이너의 월간 활성 사용자수(MAU)가 160여개국 1000만명에 달하는 만큼 데이터는 날로 정교해지고 있다. 실제로 라이너 AI는 출시 3주 만에 검색 수 1000만회를 넘어섰으며, 이를 통한 생성 단어는 130억건을 돌파했다.

◇카카오톡, 스타트업들 통해 챗GPT 입었다

"챗GPT? 한국어엔 약해"…속도전 밀린 네·카오 돌파구는
챗GPT가 주목받기 전부터 생성 AI 기반 비즈니스 분야 글쓰기 툴 '뤼튼(wrtn.ai)'을 운영해온 뤼튼테크놀로지스는 GPT-4를 비롯해 네이버 하이퍼클로바, 자체 개발한 언어모델로 문장 생성 능력을 고도화했다.

뤼튼은 50여개 이상의 비즈니스 상황에 활용 가능하며, 간단한 키워드만 입력해도 완성도 높은 초안을 만들어 '한국어를 가장 잘하는' 생성 AI 서비스로 주목받고 있다.

뤼튼테크놀로지스는 이 같은 기술력을 바탕으로 최근 대화형 인터페이스 기반 '챗 뤼튼'을 신규 출시했다. 챗 뤼튼은 자체 홈페이지와 카카오톡에서 무료로 사용할 수 있다.

챗 뤼튼처럼 카카오톡을 베이스로 챗GPT를 접목한 곳은 또 있다. 이미지 파일도 인식해 '눈 달린 챗GPT'로 불리는 AskUp(아숙업)을 개발한 업스테이지다. AskUp은 지난 5일 첫 서비스를 시작한 이후 현재 32만여명의 이용자를 확보했다.

AskUp은 챗GPT를 기반으로 업스테이지의 광학문자판독(OCR) 기술을 결합해 사용자가 문서 사진을 찍거나 전송하면 이미지 내 텍스트를 이해하고 답변한다. 최근 출시된 차세대 언어 모델 GPT-4도 적용해 답변 능력을 한층 높였다.

업스테이지는 각 기업이 비즈니스 환경에서 AskUp을 적용할 수 있도록 비즈니스 버전 'AskUp Biz'도 제작했다. 문서·홈페이지·협업툴에 적용 가능한 3가지로 구성돼 있다.

'AI 기술 강자'로 알려진 스타트업이 챗GPT를 도입한 사례도 있다. 구글코리아 R&D(연구·개발) 총괄사장을 지낸 AI 전문가 조원규 대표가 설립한 스켈터랩스다. 이 회사는 자사의 AI 챗봇에 챗GPT를 적용하며 대화 기술 수준을 한층 끌어올렸다.

이용자는 상황에 따라 초거대 AI 엔진이나 스켈터랩스 자체 개발 엔진 중 적절한 것을 선택해 적용할 수 있어 더욱 자연스러운 대화가 가능해졌다. 예약·주문·문의 등 비즈니스 용도를 넘어 상담 영역에서도 챗봇을 바탕으로 원활한 과업 수행이 이뤄질 수 있다는 설명이다.

◇사내 소통부터 여행·골프, 의료까지…일상 파고드는 GPT

[서울=뉴시스] 권창회 기자 = 출판계에 대화형 인공지능(AI) 챗GPT 바람이 거세다. 예스24에 따르면 1월 '챗GPT' 도서 판매량은 전월 대비 3.4배 증가한 데 이어 2월에는 94.5배로 급증했다. 사진은 9일 오후 서울 시내 대형서점에 진열된 챗GPT 관련 도서. 2023.03.09.[서울=뉴시스] 권창회 기자 = 출판계에 대화형 인공지능(AI) 챗GPT 바람이 거세다. 예스24에 따르면 1월 '챗GPT' 도서 판매량은 전월 대비 3.4배 증가한 데 이어 2월에는 94.5배로 급증했다. 사진은 9일 오후 서울 시내 대형서점에 진열된 챗GPT 관련 도서. 2023.03.09.
사내 소통, 여행, 골프, 의료 등 각 전문영역에서 GPT를 접목해 서비스를 고도화한 사례도 눈에 띈다. 교육·소통 플랫폼을 운영하는 클라썸은 사내 축적된 데이터를 바탕으로 효과적인 질문·답변이 가능한 'AI 도트 2.0'를 출시했다.

AI 도트 2.0은 사내 구성원 간 축적한 데이터를 바탕으로 답변하고, 답변 출처인 사내 정보까지 참조해줌으로써 사용자 스스로 신뢰도를 판단해 활용하도록 돕는다. 계속 업데이트되는 정보, 곳곳에 흩어진 정보를 모을 수 있어 생산성과 활용도가 높다.

마이리얼트립의 'AI 여행플래너'는 맛집, 명소, 날씨, 팁, 여행지 추천 등 여행 관련 다양한 주제로 실시간 대화가 가능하다. AI 여행플래너가 일정·동선에 맞는 여행 계획을 제시하고, 최저가 항공권 구매나 숨겨진 명소, 인기 여행 상품 등의 정보를 제공한다.

스크린 골프장 및 골프레슨 예약 플랫폼 김캐디는 골프 관련 궁금증을 해소할 수 있는 챗봇 'AI 김캐디'를 출시했고, 헬스케어 플랫폼 굿닥은 건강 상태에 대한 문의를 통해 병원 예약 및 비대면 진료와 연계할 수 있는 '건강 AI 챗봇'을 공개했다.

자연어 검색 전문 올거나이즈는 기업용 AI '알리GPT'를 출시했다. 알리GPT는 고객사 관련 문서와 매뉴얼 등을 활용해 답변하며, 기업이 문서를 올리면 자동으로 학습하면서 답변 수준을 높인다. 자비스앤빌런즈와 베스핀글로벌 등 다른 스타트업들도 알리GPT를 도입했다.

교육 영역에서 GPT를 활용하는 스타트업들도 있다. 코딩 교육 스타트업 엘리스는 'AI 헬피'를 통해 수강생들의 코딩 오류 수정을 돕는다. 그동안 엘리스에선 질문에 답을 얻기까지 평균 20분이 소요됐지만 AI 헬피는 단 1분 만에 답을 준다.

화상플랫폼 구루미는 마이크로소프트(MS)와 협업해 새로운 화상 교육 서비스를 개발하기로 했다. 학생들이 공부 중 궁금증을 빠르게 해소할 수 있도록 돕고, 창의적으로 공부할 수 있는 서비스를 제공할 예정이다.

업계 관계자는 "많은 스타트업들이 빅테크가 만든 초거대 AI로 사업을 확장하려는 전략을 갖고 있다"며 "이용자가 늘어날수록 GPT의 API 이용료도 커지는 만큼 GPT를 접목한 서비스를 바탕으로 새로운 수익원을 찾는 것이 과제가 될 것"이라고 내다봤다.

[머니투데이 스타트업 미디어 플랫폼 '유니콘팩토리']

챗GPT가 '나쁜 맘' 먹으면? …"러시아 범죄집단, 이미 악용중"
⑦챗GPT 활용의 나쁜 예…데이터탈취, 랜섬웨어, 다크웹 마켓플레이스

챗 gpt챗 gpt
오픈AI의 생성형 AI(인공지능)인 '챗GPT'가 해킹 등 사이버 범죄의 도구로 이용될 수 있다는 우려가 커지고 있다. 일부 보안 업체들은 이미 챗GPT를 이용한 해킹 정황을 파악해 주의를 촉구하고 나섰다.

보안 업체 체크포인트는 최근 '2023년 시큐리티 보고서'를 발표하면서 "챗GPT 등의 도구가 사이버 범죄자들에 의해 조작될 수 있다"며 "러시아 사이버 범죄자들이 오픈AI의 API 제한을 우회하고 악의적인 의도로 챗GPT에 접근한 사례 3건이 이미 입증되기도 했다"고 밝혔다.

체크포인트가 발견한 첫 번째 사례는 챗GPT를 이용해 다른 사용자 모바일 기기에 저장된 PDF 파일을 탈취하거나 C++ 프로그램 언어를 기반으로 파일 전송 시스템을 장악해 원격 서버로 빼돌릴 수 있는 악성코드를 만든 것이다. 체크포인트는 이 사례가 기술적으로 능력이 떨어지는 사이버 범죄자들이 악의적인 목적으로 챗GPT를 활용한 실제 사례라고 판단했다.

두 번째 사례는 챗GPT를 이용해 암호화 도구를 만든 것이다. 이는 약간의 수정만 거치면 다른 사용자의 컴퓨터를 완전히 암호화해 무력화시키고 대가를 노리는 랜섬웨어로 바꿀 수 있다. 체크포인트는 이 암호화 도구를 만든 사람은 랜섬웨어 방식으로 다른 사용자의 데이터베이스를 훔쳐 판 일이 있다고 설명했다.

세 번째로는 챗GPT로 다크웹 마켓플레이스를 만들어 불법거래에 사용한 것이다. 해당 마켓플레이스는 도난 계좌·카드, 악성코드, 마약 및 탄약 같은 불법 장물의 거래장소로 쓰인다. 개설자는 엄호화폐로 결제하도록 유도했다.

챗GPT를 만든 오픈AI도 이런 악용의 가능성은 인식했다. 샘 알트만 오픈AI CEO(최고경영책임자)는 지난 18일 ABC뉴스 인터뷰에서 "챗GPT를 세상에 내놓는 것이 개인적으로 조금 무섭다"면서 "챗GPT가 불법적인 일에 이용될 수 있고 사이버 공격에 이용될 수 있어 걱정한다"고 말했다.

그는 "위험도가 상대적으로 낮을 때 가능한 많은 것을 배워야 한다"며 "오픈AI 내 정책팀과 안전팀이 있지만 생성형 AI를 우리만 만드는 게 아니니 세계 주요 정부와 신뢰할 수 있는 국제기구 대표자들이 모여서 생성형 AI에 대한 규제 가이드라인을 만들어야 한다. 이 가이드라인은 개발자에게도 적용할 수 있어야 한다"고 강조했다.

한 보안 전문가는 "이미 국내에서도 챗GPT를 이용해 악성코드를 만드는 등 모의 테스트를 해봤는데 답변이 정확하지 않은 부분들이 있었다"며 "대놓고 악성코드를 만들어 달라고 하면 질문이 차단됐지만, 우회적으로 요구했을 땐 부정확하지만 그런 식으로 쓰일 수 있는 코드를 내놨다"고 말했다.

이어 "아직 크게 우려할 단계는 아니나 앞으로 충분히 악용의 소지가 높은 편이라고 보는 게 맞다"며 "전문가들 사이에선 우려의 목소리가 조금씩 나오는 것으로 안다. 챗GPT를 만든 오픈AI에서도 두렵다고 하는 만큼 앞으로 기술이 발전함에 따라 현실적인 위험이 될 수 있을 것"이라고 덧붙였다.
TOP