알파고 개발자 "긴 여정의 첫 걸음…의료 AI 곧 나온다"

머니투데이 김지민 기자 | 2016.03.08 16:25

딥마인드 데이비드 실버 박사 방한…"바둑은 시작점에 불과..맞춤형 의료, 가정용 로봇 등에 활용"


"알파고는 긴 여정의 첫 걸음입니다. 이번 대국을 통해 알파고를 보다 높은 수준으로 발전시키고 의료, 로봇 등 다양한 목적으로 활용할 수 있는 제품을 만들 겁니다."

구글 딥마인드에서 인공지능(AI) 프로그램 '알파고' 개발을 총괄한 데이비드 실버 박사(사진)가 이세돌 9단과 알파고의 대국을 앞둔 8일 한국을 찾았다. 2004년 세계 최초로 9줄 바둑 마스터 레벨프로그램을 개발한 실버 박사는 바둑과 관련한 논문을 꾸준히 발표해온 바둑 소프트웨어 전문가이자 알파고 개발 과정을 주도해 온 책임자다.

이날 소프트웨어정책연구소가 주관한 AI 컨퍼런스에 참석한 실버 박사는 "알파고는 바둑 뿐 아니라 다른 과업을 수행할 수 있도록 하는 밑거름이 될 것"이라며 구글이 지향하는 'AI 세상'에 대해 입을 열었다.

딥마인드는 향후 알파고를 개인 맞춤형 의료 서비스, 가정용 로봇 등의 영역으로 확대 발전시킨다는 계획이다. 실버 박사는 딥마인드가 현재 맞춤형 의료 서비스를 제공하기 위해 영국 국립 보건국과 협업 중이며 개개인의 의료 데이터를 학습 중이라는 사실을 공개했다.

그는 "지금 알파고는 바둑을 두는 기계지만 이것은 시작점에 불과하다"며 "알파고를 보다 일반화시켜 지도학습을 통해 각 가구에 가정용 로봇을 설치하는 방식도 고민하는 등 흥미로운 가능성을 시험하려고 한다"고 말했다.

알파고가 기존 AI에 비해 뛰어난 기량을 확보할 수 있었던 배경에는 '가치망 네트워크'과 '정책망 네트워크'라는 두 가지 핵심기술이 있었기에 가능했다는 설명이다. 가치망 네트워크가 포지션별 형세를 파악해 승률을 추정하는 기술이라면, 정책망 네트워크는 전체 바둑판의 확률 지도를 만드는 역할을 담당한다.


실버 박사는 "알파고는 가치망 네트워크를 통해 가능성 있는 경우의 수를 추려내고 정책망 네트워크를 통해 좁혀진 경우의 수를 분석, ‘좋은 수’를 둘 수 있는 능력을 갖췄다"며 "특히 정책망 네트워크를 통해 프로 기사들의 착수를 학습, 사람과 최대한 비슷하게 바둑을 둘 수 있다는 점이 중요한 특징"이라고 강조했다.

알파고는 데이터를 학습해 모방하는 기술이 아닌 실제 자가학습을 통해 시행착오를 거친 후 발전하는 소프트웨어라는 설명도 곁들였다. 그는 "3000만개의 포지션을 학습한 알파고는 3000만 번에 달하는 셀프 대국을 치르면서 이기고 지는 과정을 모두 보게 했다"며 "승수와 패수를 구분하는 강화학습도 병행했다"고 말했다.

짱짱한 학습량으로 무장한 알파고의 실력은 인간에 못지 않은 것으로 알려져 있다. 지난해 10월 구글 자체 테스트 결과에 따르면 알파고는 데스크톱 컴퓨터 프로그램과 495번의 경기를 치러 단 한 번을 제외하고 모두 승리했고 유럽 바둑챔피언 판후이도 꺾었다.

이처럼 인간에 못지않은 실력을 겸비한 알파고이지만 진짜 프로 바둑기사처럼 바둑을 두는 수준에 이르기까지는 더 많은 시간이 필요하다는 판단이다. 실버 박사는 "알파고가 특정 기사의 소량의 기보를 학습한 것이 아니고 이 9단이나 전문 기사들의 기력까지 가진 않았다고 생각한다"며 말을 아꼈다.

베스트 클릭

  1. 1 의정부 하수관서 발견된 '알몸 시신'…응급실서 실종된 남성이었다
  2. 2 "건드리면 고소"…잡동사니로 주차 자리맡은 얌체 입주민
  3. 3 "나이키·아디다스 말고…" 펀러닝족 늘자 매출 대박 난 브랜드
  4. 4 [단독]음주운전 걸린 평검사, 2주 뒤 또 적발…총장 "금주령" 칼 뺐다
  5. 5 "갑자기 분담금 9억 내라고?"…부산도 재개발 역대급 공사비