테러에도 버틴다던 IDC에 화재? 카카오 48시간 먹통 미스터리

머니투데이 홍효진 기자, 황국상 기자 2022.10.17 17:39
글자크기
(성남=뉴스1) 황기선 기자 = 17일 오전 경기 성남시 분당구 SK C&C 판교캠퍼스 카카오 데이터센터 화재현장에서 관계자들이 와이어로프 등 복구작업을 위한 자재를 옮기고 있다.  2022.10.17/뉴스1  Copyright (C) 뉴스1. All rights reserved. 무단 전재 및 재배포 금지.(성남=뉴스1) 황기선 기자 = 17일 오전 경기 성남시 분당구 SK C&C 판교캠퍼스 카카오 데이터센터 화재현장에서 관계자들이 와이어로프 등 복구작업을 위한 자재를 옮기고 있다. 2022.10.17/뉴스1 Copyright (C) 뉴스1. All rights reserved. 무단 전재 및 재배포 금지.


지난 15일 발생한 카카오 먹통을 초래한 데이터센터 화재사고와 관련한 의문점이 증폭되고 있다. 통상 데이터센터는 외부해킹은 물론 지진이나 테러 같은 물리적 사고에도 안정적으로 운영돼야 하는 핵심 기간시설이다. 일반건물과 달리 2, 3중의 화재방지 시스템을 갖춘 데이터센터가 초기 진화에 실패한 것이다.

건물 전소가 아닌 설비 일부의 화재로 데이터센터가 전면 가동중지에 들어간 것도 극히 이례적이다. 카카오가 전산시스템의 이중화에 실패한 것은 비판받아 마땅하지만 장애의 원인을 제공한 SK C&C도 손해배상 관련 책임 공방에서 자유롭지 못할 것으로 보인다. 사실상 전원공급 차단 외에는 서버에 물리적 타격이 없던 카카오의 시스템이 사흘째 완전복구가 되지 않는 것도 의문점이다.



의문점 1. 진화 시스템, 왜 불길 못잡았나
17일 경찰에 따르면 불은 지하 3층 전기실 배터리에 불꽃이 발생하며 시작됐다. 문제가된 배터리는 한국전력 등으로부터 공급받는 전원이 일시 중단될 때 비상용으로 가동하기 위한 2차 전원이었다. 이 전원이 제대로 작동하지 않을 때는 UPS(비상정원공급시스템) 배터리가, 최후에는 디젤발전기가 쓰인다. 바로 이 배터리에 불이 붙었다. CCTV에서는 화재 발생직후 자동 소화장비가 작동는 모습도 촬영됐다. 이 장비는 화재 연기가 감지될 때 자동으로 청정소화액제(고압 하론가스)가 살포돼 산소를 차단해 소화하는 방식이다. 통상 IDC는 감전우려와 함께 시스템 손상을 막기위해 이같은 가스기반 소화장치를 우선 사용한다. 그런데 진화 시스템이 작동을 했음에도 5개의 배터리랙 중 1개에서는 계속 고열과 연기가 뿜어져 나왔다. 결과적으로 진화장치가 초진에 실패한 것이다. 이와관련 최근 빈발하는 전기차 배터리 화재처럼 IDC의 비상용 배터리 화재에 대한 대응이슈가 확산될 전망이다.

의문점 2. 전원공급 전면 차단, 왜 감행됐나
(성남=뉴스1) 황기선 기자 = 소방과 경찰 관계자들이 17일 오전 경기 성남시 분당구 SK C&C 판교캠퍼스 카카오 데이터센터 화재현장에서 현장감식을 위해 이동하고 있다. 2022.10.17/뉴스1  Copyright (C) 뉴스1. All rights reserved. 무단 전재 및 재배포 금지.(성남=뉴스1) 황기선 기자 = 소방과 경찰 관계자들이 17일 오전 경기 성남시 분당구 SK C&C 판교캠퍼스 카카오 데이터센터 화재현장에서 현장감식을 위해 이동하고 있다. 2022.10.17/뉴스1 Copyright (C) 뉴스1. All rights reserved. 무단 전재 및 재배포 금지.
화재 발생 당일 소방당국도 즉각 현장에 출동했다. 이들은 진화시스템이 완전진화에 실패한 상황을 확인하고 자체 설비로 진화를 시도했지만 여의치않자 1시간 30분쯤 뒤인 오후 4시52분쯤 물을 뿌리는 살수 진화를 결정했다. 이 과정에서 SKC&C와 협의해 화재에도 정상 공급해오던 시스템 전원을 완전 차단키로 했다. 초고압 전기를 다루는 전기실 공간의 특성상 소방관 감전 등 인명피해가 발생할 우려가 있어서였다. 서버 전원을 차단하는 것은 고객사 시스템이 중단된다는 것을 의미한다. 최후의 선택이지만 불이 더 번지는 것을 막기위해서는 불가피한 결정이었다는 것이다. 전원차단 결정을 고객사인 카카오 등과 협의했는지는 확인되지 않고있다.



의문점 3. 배터리 노후화, 관리부실 문제는 없었나
당국은 불에 탄 배터리와 전선 등 현장 잔해를 수거해 국립과학수사연구원에 의뢰했다. 국과수 조사 결과 화재 발발 초기 상황이 규명될 것으로 보인다. 이 배터리 제조사가 어디였는지, 왜 배터리에서 화재가 발생했는지는 아직 공개되지 않았다. 다만 배터리에서 화재가 발생했다는 점이 확인된 만큼 SK C&C 측의 배터리 관리소홀책임 등도 제기된다. 노후 배터리를 제때 교체하지 않았다거나 배터리 랙의 먼지 등을 제대로 제거하지 않아 화재의 원인을 제공한 것 아니냐는 지적이다. SK C&C는 "전기실에 비치된 배터리는, 10년 성능 보증이 되는 전기차용 배터리와 유사한 것"이라며 "해당 배터리랙도 2016년 데이터센터 준공 이후에나 도입된 것이기에 배터리 노후화 등에 대한 지적은 맞지 않다"고 했다. SKC&C 설명대로라면 배터리 자체의 결함이나 운영과정에서의 파손 등 가능성이 제기될 수 있다.

의문점 4. 복구 왜 이리 오래 걸리나
카카오는 화재 발생 이튿날 과기정통부, SK C&C와 함께 진행한 브리핑에서 판교 데이터센터에 비치된 자사의 서버가 3만2000여대에 이른다고 했다. 또 전원만 제때 공급되면 2시간이면 서비스 대부분이 정상복구될 것으로 전망했다. 그런데 복구 상황은 여의치 않았다. 15일 오후 3시33분 사고 이후 현재까지 49시간 이상 지났음에도 여전히 다음메일이나 다음검색 등 상당수 서비스는 정상화되지 않고 있다.

이는 카카오가 메시징 기반 서비스로 단일 기업으로는 가장 많은 전국민 데이터를 보유하고 있기 때문인 것으로 진단된다. 이기혁 중앙대 융합보안학과 교수는 "데이터 자체가 문제라기보다는 로드 밸런싱(Load Balancing), 즉 데이터센터 내에서 증가하는 트래픽을 다수 서버로 분산시켜 대응하는 서비스가 제대로 안되기 때문으로 보인다"며 "서버가 과부하되면 다른 서버로 트래픽을 분산시켜 서비스를 연속적으로 이어지게 해줘야 한다"고 했다.


또 "DR(Disaster Recovery, 재해복구) 훈련이 제대로 안됐을 가능성도 있다"며 "데이터센터 내에서의 재해 발생시 서버구성 등에 대한 연습이 잘 됐더라면 대응이 더 빨랐을 것"이라고 지적했다.
(서울=뉴스1) 송원영 기자 = 판교 데이터센터 화재로 카카오 그룹주가 급락한 가운데 17일 오전 서울 여의도 한국거래소 모니터에 카카오 주가가 나오고 있다.   한국거래소에 따르면 오전 10시36분 카카오는 전 거래일 대비 2600원(5.06%) 떨어진 4만8800원에 거래되고 있다.  이날 카카오그룹 ‘4총사’로 불리는 카카오, 카카오뱅크, 카카오페이, 카카오게임즈 등은 동반 하락세를 보였다. 2022.10.17/뉴스1  Copyright (C) 뉴스1. All rights reserved. 무단 전재 및 재배포 금지.(서울=뉴스1) 송원영 기자 = 판교 데이터센터 화재로 카카오 그룹주가 급락한 가운데 17일 오전 서울 여의도 한국거래소 모니터에 카카오 주가가 나오고 있다. 한국거래소에 따르면 오전 10시36분 카카오는 전 거래일 대비 2600원(5.06%) 떨어진 4만8800원에 거래되고 있다. 이날 카카오그룹 ‘4총사’로 불리는 카카오, 카카오뱅크, 카카오페이, 카카오게임즈 등은 동반 하락세를 보였다. 2022.10.17/뉴스1 Copyright (C) 뉴스1. All rights reserved. 무단 전재 및 재배포 금지.
TOP