알파스타가 스타크래프트2 종족 프로토스로 게임을 하는 모습/자료=네이처
구글 딥마인드는 온라인 게임 전용으로 개발한 AI 프로그램 '알파스타'(AlphaStar)가 대표적 실시간 전략 게임(RTS) '스타크래프트2'에서 배틀넷(대전)을 펼쳐 '그랜드 마스터' 레벨(상위 0.2% 해당 플레이어)에 올랐다"고 31일 국제학술지 네이처에 발표했다.
스타크래프트2에는 특성과 능력치가 다른 3개 종족(테란·저그·프로토스)이 등장한다. 앞서 지난 1월에 개발된 버전 초기 단계 알파스타는 3개 종족을 모두 자유롭게 활용하지 못했지만, 한층 업그레이드 된 알파스타는 세 종족을 모두 능수능란하게 다뤘다. 딥마인드는 3종족으로 한 게임 모두 그랜드 마스터 레벨에 올랐다고 밝혔다. 딥마인드에 따르면 알파스타의 전체 평균 승률은 99.8%에 달한다. 또 1대 3의 승부에서도 99.76~99.93%의 승률을 나타냈다.
알파스타가 스타크래프트2에서 종족 저그를 택해 게임을 진행하고 있다/자료=네이처
알파스타의 새로운 AI 알고리즘은 카메라로 촬영한 게임 화면을 통해 상황을 인지하고 자체적으로 전략을 세우는 방식의 강화학습으로 탄생했다. 딥마인드 관계자는 “알파스타는 프로 게이머들의 훈련방식과 마찬가지로 AI간 배틀넷을 통한 ‘멀티 에이전트 강화학습’ 훈련을 해왔다”고 설명했다. 멀티 에이전트 강화학습은 간단히 말해 여러 개의 AI들이 협업·경쟁을 통해 학습하는 알고리즘이다.
데이비드 하사비스 딥마인드 창업자겸 최고경영자(CEO)는 "스타크래프트는 바둑보다 경우의 수가 더 많아 AI 개발자들이 쉽게 넘볼 수 없었다”며 “실시간으로 변화하는 예측하기 힘든 상황에서 최적의 답을 찾아내는 알파스타의 새로운 알고리즘은 향후 '범용 AI 알고리즘' 수준으로 발전해 자율주행차, 로봇 등 모든 분야에서 활용될 것”이라고 말했다.