5일 업계에 따르면 네이버클라우드는 국내 기업 대상으로 오는 10월 출시되는 '뉴로클라우드' 영업에 나선다. 외산 생성형 AI의 공세 속에 한국 기업의 사정을 가장 잘 아는 서비스로 차별화한다. 뉴로클라우드란 클라우드와 온프레미스(On-premise·자체구축형)를 결합한 서비스로, 고객사 데이터센터에 서버 인프라를 직접 설치해 차세대 LLM(초거대언어모델) 하이퍼클로바X를 편하게 이용하되 민감정보의 외부 유출을 원천 차단한 게 특징이다.
기업이 생성형 AI를 쓰는 데 걸림돌이었던 학습·보안 문제를 해결했다는 설명이다. 이에 따라 생성형 AI를 도입하려는 기업도 급증할 전망이다. 이미 미국 경제전문지 포천이 선정한 글로벌 500대 기업(매출액 기준)의 80% 이상이 챗GPT를 이용 중이다.
그러나 전문가들은 여전히 국산 생성형 AI의 강점이 크다고 입을 모은다. 하정우 네이버클라우드 AI이노베이션 센터장은 "금융사를 비롯해 대부분의 기업은 데이터를 해외 클라우드에 올리는 것 자체를 꺼린다"라며 "외산 기업용 생성형 AI에 대한 우려가 근본적으로 해결되지 않았다"라고 꼬집었다. 이주열 LG CNS 수석연구위원도 "기업 데이터가 한국 영토를 벗어나는 건 크리티컬한 이슈"라며 "LLM을 온프레미스로 구축하는 사업을 강화할 예정"이라고 말했다.
"독도는 분쟁지역"이라는 외산 AI, 국방·국력 문제 될라고가의 비용도 난제다. LLM은 '토큰'(AI가 인식하는 문자 데이터 단위) 단위로 과금하는데, 영어보다 한국어 사용 시 더 많은 토큰이 필요하다. 예컨대 3만2000개 토큰을 지원하는 챗GPT 엔터프라이즈는 영어로 2만5000단어를 쓸 수 있는 반면, 한글은 1만2800자에 그친다. 이 때문에 같은 양의 문서 처리 시 국내기업이 영어권보다 2배 비싼 사용료를 내면서도 속도는 더 느리다.
이 시각 인기 뉴스
한국어에 최적화된 LLM이 필요한 이유다. 오픈AI가 운영하는 토크나이저에 따르면 GPT-3는 'That's OK' 9글자를 토큰 3개로 인식하지만 한글 '괜찮아'는 3글자인데도 9개 토큰을 쓴다. 자음과 모음을 모두 토큰으로 분류했다. 반면 한국어에 익숙한 국산 LLM은 띄어쓰기나 음절·형태소를 기준으로 토큰화해 비용이 훨씬 줄어들 수 있다. 단, 기업이 이용한 만큼 과금하는 클라우드 방식과 달리 온프레미스로 구축했을 때 구축비가 더 들 수는 있다.
구글·애플이 모바일 운영체제(OS) 시장지배력을 활용해 모든 앱 사업자에 영향력을 행사하듯, 글로벌 빅테크에 종속되지 않으려면 AI 주권을 확보해야 한다는 목소리도 있다. 서구문화 중심의 생성형 AI가 한국의 문화적 정체성을 약화할 수 있다는 지적도 나온다. 챗GPT는 독도에 대해 "한국·일본이 소유권 분쟁을 벌이는 지역"이라고 답하지만, 네이버 클로바X는 "한국 영토"라고 확답하는 게 대표적이다.
이에 대해 이광형 카이스트 총장은 최근 포럼에서 "AI는 독도를 일본 땅이라 하고 선생님은 한국 땅이라 하면 어린이들이 헷갈릴 것"이라며 "AI는 주권이자 국방, 국력과 직결된다. AI를 만든 국가의 지배를 받지 않으려면 한국형 AI를 육성해야 한다"고 강조했다.
'독도는 어느나라 땅이야'라고 물었을때 네이버 클로바X의 답변(위)과 오픈AI 챗GPT 답변. /사진=각 서비스 캡처