'방언만 수천개' 여기서 통하면 다 통해…AI 기업들 몰리는 나라

머니투데이 김희정 기자 2024.06.25 15:21
글자크기

인도 공식언어 22개, 방언 포함해 수천개 언어사용돼
언어모델 시험 최적화…인구 14억으로 잠재 수요 커

지난 8일(현지시각) 인도 하이데라바드에서 천식에 걸린 어린이가 약초 반죽을 채운 생정어리를 삼키려 입을 벌리고 있다. 매년 수천 명의 천식 환자가 이곳에서 바시니 구드 가문으로부터 생선 치료를 받는 것으로 알려졌다. 구드 가문에만 전해지는 이 치료는 무료이나 환자는 물고기를 사야 한다. 환자들은 몸 안에 들어간 물고기가 퍼덕거리며 가래를 없애준다고 믿고 있다./AP=뉴시스지난 8일(현지시각) 인도 하이데라바드에서 천식에 걸린 어린이가 약초 반죽을 채운 생정어리를 삼키려 입을 벌리고 있다. 매년 수천 명의 천식 환자가 이곳에서 바시니 구드 가문으로부터 생선 치료를 받는 것으로 알려졌다. 구드 가문에만 전해지는 이 치료는 무료이나 환자는 물고기를 사야 한다. 환자들은 몸 안에 들어간 물고기가 퍼덕거리며 가래를 없애준다고 믿고 있다./AP=뉴시스


글로벌 IT기업들이 인공지능(AI) 플랫폼의 테스트베드로 세계 최대인 14억 인구의 인도 시장을 두드리고 있다. 방언을 포함하면 수천개의 언어를 사용해 언어모델을 시험하기 최적화된 데다 방대한 인구만큼 수요가 폭증할 수 있어서다.

파이낸셜타임즈는 24일(현지시간) 거대 IT 기업들의 인도 AI 시장 진출 현황을 소개했다. 이곳에서는 마이크로소프트, 구글을 비롯해 실리콘밸리의 지원을 받는 현지 스타트업 사르밤AI, 인도 모바일그룹 올라가 세운 크루트림 등이 힌디, 타밀 등 현지 언어로 AI 음성비서와 챗봇을 선보이고 있다. 고객지원, 콜센터 등 인도에서 급성장하는 산업에서 활용하는 데 주안점을 둔다.



인도는 힌디어가 가장 대중적이나 공식 언어만 22개다. 방언까지 포함하면 수천개의 언어가 난무한다. 구글은 이런 현실을 반영해 지난주 9개의 인도 언어로 제미나이 AI 비서를 출시했다. 마이크로소프트의 코파일럿 AI 비서도 12개 인도 언어로 사용 가능하다.

마이크로소프트는 방갈로르 소재 리서치센터에서 '작은' 규모의 언어모델을 구축하는 작업도 병행 중이다. 대규모 언어모델(LLM)과 달리 중소 규모의 언어모델은 훨씬 저렴한 가격에 생성형 AI를 스마트폰에서 구현할 수 있게 해준다. 인도의 상황에 맞게 맥락화 해 AI를 보다 간단하고 사용하기 쉽게 만들겠단 전략이다. 마이크로소프트는 사르밤AI와도 손을 잡았다.



사티아 나델라 마이크로소프트(MS) CEO가 지난 4월 30일 자카르타에서 개최한 AI 데이 행사에서 MS의 코파일럿에 대해 설명하고 있다./AFPBBNews=뉴스1사티아 나델라 마이크로소프트(MS) CEO가 지난 4월 30일 자카르타에서 개최한 AI 데이 행사에서 MS의 코파일럿에 대해 설명하고 있다./AFPBBNews=뉴스1
각 나라마다 AI를 자국에서 훈련시켜 관련 기술과 노하우가 현지에 남을 수 있게 'AI 주권'을 강화하는 추세다. 이로 인해 AI 공급망이 파편화되면서 현지 기업을 통해 투자하는 게 보다 보다 중요해졌다. 인도 국민의 데이터, 오디오, 비디오, 문서, 다양한 언어에 대한 기반모델을 훈련시키려면 인도의 사용 사례와 인도 거주자, 인도 기업에 초점을 맞춘 현지 기업이 돼야 한다는 뜻이다.

인도 시장의 AI 경쟁은 오픈AI처럼 막대한 자금과 자원을 투입해 LLM을 구축하는 것과는 결이 다르다. 대신 사르밤AI 같은 현지 스타트업들은 기존에 있는 LLM을 인도의 다양한 언어에 적응시키는 데 주안점을 두고 있다. 인도는 문자보다 음성 대화를 더 선호하기 때문에 이 같은 접근법이 현지 사용자에겐 보다 효율적이다.

마이크로소프트의 인도 방갈로르 연구소 타누자 가누 연구원은 FT에 "인도처럼 다양하고 거대한 나라에서 새로운 기술과 수단을 테스트하는 이점은 이를 이용해 어디든 다른 곳으로 수출할 수 있다는 것"이라며 "인도를 테스트베드(시험장)로 삼아 일부 기술을 검증하고 이를 다른 지역으로 확장할 수 있는 방법을 모색하고 있다"고 밝혔다.

TOP