카이스트(KAIST) 산업 및 시스템공학과 이재길 교수 연구팀은 방역·격리 시설 운영, 고위험 국가 입국자 관리 정책 등에 폭넓게 활용할 수 있는 ‘코로나19 해외유입 확진자 수 예측 AI 모델’(Hi-COVIDNet)을 개발했다고 19일 밝혔다.
이 기술은 해외 각국의 확진자 수와 사망자 수, 해외 각국에서의 코로나19 관련 키워드 검색빈도 및 한국으로의 로밍 고객 입국자 수, 한국으로의 일일 항공편 수 등의 빅데이터를 AI 모델로 분석,향후 2주간의 해외유입 확진자 수를 예측한다.
코로나19 확진자 수가 급증할수록 해외유입에 의한 지역사회 확산의 위험성도 함께 뒤따른다. 특정 국가로의 해외유입 확진자 수 동향은 다양한 요인에 의해 영향을 받는다. 일반적으로 해외 각국에서의 코로나19 위험도와 비례하며, 해외 각국에서 한국으로의 입국자 수와도 비례한다. 연구팀은 이런 경향을 모델링 할 수 있도록 다양한 종류의 빅데이터를 활용했다.
연구진에 따르면 우선 해외 각국의 코로나19 위험도는 보고된 확진자 수·사망자 수를 활용했다. 그러나 이 같은 수치는 진단검사 수에 좌우되기 때문에 코로나19 관련 키워드 검색빈도를 같이 입력해 실시간으로 해당 국가의 코로나19 위험도를 산출했다.
실시간 입국자 수는 기밀정보로서 외부에 공개되지 않기 때문에 매일 제공되는 한국 도착 항공편수와 로밍 고객 입국자 수를 통해 유추해냈다. 다만, 로밍 고객 입국자 수 데이터는 한국 국적의 입국자만을 주로 포함하기 때문에, 일일 항공편수를 함께 넣는 방식으로 이 문제를 해소했다.
또 연구팀은 국가 간의 지리적 연관성도 중요하게 고려했다. 특정 국가의 코로나19 발병은 이웃 국가로 쉽게 전파되며, 국가 간 교류도 거리에 따라 영향을 받기 때문이다. 이에 따라 연구팀은 AI가 지리적 연관성을 학습하도록 국가-대륙으로 구성된 지리적 계층구조를 입력했고, 이 데이터에 따라 각 대륙으로부터의 해외유입 확진자 수를 정확히 예측할 수 있도록 설계했다.
이후 연구팀은 약 한 달 반 동안 훈련 데이터로 생성된 Hi-COVIDNet을 통해 향후 2주간 한국으로의 해외유입 확진자 수를 예측한 결과, 일정 시간을 주기로 생성되는 시계열 데이터 예측 머신러닝(기계학습) 접근법 또는 기존 딥러닝(심층학습) AI 모델 보다 예측 정확도가 최대 35% 더 높다는 것을 확인했다.
이 교수는 “해외유입 확진자 수 예측결과는 검역관, 진단키트 등의 검역자원 배치, 입국자 자가격리시설 확보, 정부의 입국검역 강화와 특별 입국절차 제정에 대한 근거로 활용할 수 있을 것”이라고 말했다.
이번 기술 개발엔 KAIST 지식서비스공학대학원에 재학 중인 김민석 박사과정 학생이 제1 저자로, 강준혁, 김도영, 송환준, 민향숙, 남영은, 박동민 학생이 제2~제7 저자로 각각 참여했으며, KT와 과학기술정보통신부의 ‘코로나19 확산예측 연구 얼라이언스’를 통해 로밍 데이터 세트를 지원받아 이뤄졌다.
[저작권자 @머니투데이, 무단전재 및 재배포 금지]