언어모델 시험하기 '딱'…인도로 가는 AI 기업들

머니투데이 김희정 기자 | 2024.06.26 06:06
글로벌 IT기업들이 인공지능(AI) 플랫폼의 테스트베드로 세계 최대인 14억 인구의 인도 시장을 두드리고 있다. 방언을 포함하면 수천개의 언어를 사용해 언어모델을 시험하기 최적화된 데다 방대한 인구만큼 수요가 폭증할 수 있어서다.

인도 북부 우타르프라데시주 샤밀 지역의 남성 유권자들이 총선 첫날인 지난 4월19일 투표를 위해 긴 줄을 서있다. /AFPBBNews=뉴스1
파이낸셜타임즈는 24일(현지시간) 거대 IT 기업들의 인도 AI 시장 진출 현황을 소개했다. 이곳에서는 마이크로소프트, 구글을 비롯해 실리콘밸리의 지원을 받는 현지 스타트업 사르밤AI, 인도 모바일그룹 올라가 세운 크루트림 등이 힌디, 타밀 등 현지 언어로 AI 음성비서와 챗봇을 선보이고 있다. 고객지원, 콜센터 등 인도에서 급성장하는 산업에서 활용하는 데 주안점을 둔다.

인도는 힌디어가 가장 대중적이나 공식 언어만 22개다. 방언까지 포함하면 수천개의 언어가 난무한다. 구글은 이런 현실을 반영해 지난주 9개의 인도 언어로 제미나이 AI 비서를 출시했다. 마이크로소프트의 코파일럿 AI 비서도 12개 인도 언어로 사용 가능하다.

마이크로소프트는 방갈로르 소재 리서치센터에서 '작은' 규모의 언어모델을 구축하는 작업도 병행 중이다. 대규모 언어모델(LLM)과 달리 중소 규모의 언어모델은 훨씬 저렴한 가격에 생성형 AI를 스마트폰에서 구현할 수 있게 해준다. 인도의 상황에 맞게 맥락화 해 AI를 보다 간단하고 사용하기 쉽게 만들겠단 전략이다. 마이크로소프트는 사르밤AI와도 손을 잡았다.


각 나라마다 AI를 자국에서 훈련시켜 관련 기술과 노하우가 현지에 남을 수 있게 'AI 주권'을 강화하는 추세다. 이로 인해 AI 공급망이 파편화되면서 현지 기업을 통해 투자하는 게 보다 보다 중요해졌다.

인도 국민의 데이터, 오디오, 비디오, 문서, 다양한 언어에 대한 기반모델을 훈련시키려면 인도의 사용 사례와 인도 거주자, 인도 기업에 초점을 맞춘 현지 기업이 돼야 한다는 뜻이다. 사르밤AI 같은 현지 스타트업들은 기존에 있는 LLM을 인도의 다양한 언어에 적응시키는 데 주안점을 두고 있다. 인도는 문자보다 음성 대화를 더 선호하기 때문에 이 같은 접근법이 현지 사용자에겐 보다 효율적이다.

마이크로소프트의 인도 방갈로르 연구소 타누자 가누 연구원은 FT에 "인도처럼 다양하고 거대한 나라에서 새로운 기술과 수단을 테스트하는 이점은 이를 이용해 어디든 다른 곳으로 수출할 수 있다는 것"이라며 "인도를 테스트베드(시험장)로 삼아 일부 기술을 검증하고 이를 다른 지역으로 확장할 수 있는 방법을 모색하고 있다"고 밝혔다.

베스트 클릭

  1. 1 "임신한 딸이 계단 청소를?"…머리채 잡은 장모 고소한 사위
  2. 2 [단독]유승준 '또' 한국행 거부 당했다…"대법서 두차례나 승소했는데"
  3. 3 "대한민국이 날 버렸어" 홍명보의 말…안정환 과거 '일침' 재조명
  4. 4 "봉하마을 뒷산 절벽서 뛰어내려"…중학교 시험지 예문 논란
  5. 5 유명 사업가, 독주 먹여 성범죄→임신까지 했는데…드러난 '충격' 실체