미세먼지는 국외 요인 때문?...빅데이터로 예보 정확도 향상

머니투데이 오세중 기자 2019.01.28 16:00
글자크기

행정안전부 국가정보자원관리원과 UN글로벌펄스가 미세먼지 예측 및 주요 요인 파악

전국 대부분 지역의 미세먼지 수준이 '매우 나쁨'에서 '나쁨' 수준으로 낮춰진 지난 1월 15일 오후 남산에서 바라 본 도심이 오전과 다른 모습을 보이고 있다./사진=김창현 기자전국 대부분 지역의 미세먼지 수준이 '매우 나쁨'에서 '나쁨' 수준으로 낮춰진 지난 1월 15일 오후 남산에서 바라 본 도심이 오전과 다른 모습을 보이고 있다./사진=김창현 기자


미세먼지의 고농도 현상이 잦아지져 국민건강을 위협하는 가운데 정부가 빅데이터 분석을 통해 미세먼지 예측의 정확도를 높이고 있다. 특히 이번 분석에서 미세먼지 발생의 국외 요인을 제외하자 대기질 '좋음' 등급이 50%가량 늘은 것으로 나타났다.

행정안전부 국가정보자원관리원은 "UN 글로벌 펄스 자카르타 연구소와 업무협력(MOU)을 지난해 4월 체결해 동북아 지역의 미세먼지 예측 및 주요 요인을 데이터에 기반해 분석했다"고 28일 밝혔다.



자원관리원은 국내외 요인을 정확히 파악하기 위해 서해안의 인구 밀집지역인 인천지역을 분석대상으로 선정했고, 기존의 수치예측모델과 달리 머신러닝을 활용했다.

이를 통해 △내일의 미세먼지 예측을 위한 미세먼지 예측모델 개발 △미세먼지에 영향을 미치는 주요 요인 등을 파악한 것이다.



이번 분석에는 2015년 1월부터 지난해 3월까지의 △인천 지역 미세먼지·대기오염 데이터(환경부, 2만8464건) △미국항공우주국(NASA)에서 제공하는 동북아 지역의 위성 센서 데이터 △에어로넷의 지상 관측 센서 데이터를 활용했다.

에어로넷은 NASA가 운영하는 국제 공동 에어로졸(지구 대기 중을 떠도는 미세한 고체 입자 또는 액체 방울) 관측 네트워크다.

이번 분석에는 우선 미세먼지 예보에 최적의 성능을 보인 그래디언트 부스팅(약한 예측 모델을 결합, 예측도를 향상시키는 기계 학습 모델) 기반의 예측 모델을 구현했다.


지난해 1분기를 예측한 결과, 미세먼지(PM10) 84.4%, 초미세먼지(PM2.5) 77.8%의 정확도를 보여 기존 국내 미세먼지 예보에 비해 정확도가 약 15% 높아진 것을 확인할 수 있었다.

주요 예측변수로는, 미세먼지의 경우 풍향, 강우량, 서해안 및 중국 산둥성 지역의 에어로졸 농도로, 초미세먼지의 경우 풍속, 풍향 및 중국 내몽골, 베이징·허베이성 지역의 에어로졸 농도로 나타났다.

구체적으로 '나쁨'일 경우 풍향은 서풍이 불며 산둥성, 산시성, 베이징·허베이성 등의 중국 지역의 에어로졸 농도가 매우 높다는 것을 확인할 수 있었다.

특히 인천지역 20개 관측소의 미세먼지 예측 연관성을 비교한 결과, 인천 도심 지역이 아닌 백령도 지역의 미세먼지 및 이산화질소(NO2)가 가장 높은 연관성을 보였으며, 이는 국내 요인보다 국외 요인이 상대적으로 높음을 보여주는 결과다.

또, 데이터에서 국외 요인을 제거 후 2018년 1분기를 예측한 결과, '좋음' 등급은 20일에서 30일로 50%나 증가하는 것으로 나타났다.

김명희 행정안전부 국가정보자원관리원장은 "이번 분석은 국민의 생존권과 직결되는 미세먼지 문제를 빅데이터로 접근한 아주 의미있는 사례"라면서 "미세먼지 예보에 기계학습 예측모델이 적극적으로 활용되기를 기대하고, 향후에도 재난·안전 등 사회적 가치가 높은 분석과제를 지속적으로 수행해 국민 삶의 질이 개선되도록 노력할 계획"이라고 밝혔다.
TOP