최적제어 이론에서 출발한 강화학습은 기계 학습의 한 영역으로 지난 20여 년간 꾸준히 연구된 분야이다. 지난 5년 동안은 딥러닝 기술을 발전과 맞물려 급격한 성장을 이뤘다.
그러나 주어진 문제에 맞게 시스템을 설계해야 하는 점, 불확실성이 높은 환경에서는 성능이 보장되지 않는 점 등이 근본적인 해결책으로 남아있다.
연구팀은 이번 연구에서 강화학습 등의 개별 AI 알고리즘이 해결하지 못하는 공학적 문제를 인간의 두뇌가 이미 해결하고 있다는 사실에 기반한 ‘전두엽 메타 제어’ 이론을 제안했다.
이 원리를 단일 인공지능 알고리즘이나 로봇설계에 적용하면 외부 상황변화에 강인하게 성능·효율·속도 세 조건 사이의 균형점을 유지하는 최적의 제어 시스템을 설계할 수 있다. 나아가 다수의 AI 개체가 협력하는 상황에서는 서로의 전략을 이용함으로 협력-경쟁 사이의 균형점을 유지할 수 있다.
이상완 교수는 “연구를 하다 보면 우리의 두뇌는 공학적 난제를 의외로 쉽게 해결하고 있음을 알 수 있다”며 “이 원리를 AI 알고리즘 설계에 적용하는 뇌 기반 AI 연구는 구글 딥마인드, MIT(매사추세츠공대), 캘리포니아 공과대학 등 해외 유수 기관에서도 관심을 두는 신경과학-인공지능 융합 연구 분야”라고 말했다. 이어 “장기적으로는 차세대 AI 핵심 연구 분야 중의 하나로 자리를 잡을 것”이라고 덧붙였다. 이번 연구성과는 국제학술지 사이언스의 자매지인 ‘사이언스 로보틱스’ 온라인판에 게재됐다.