검색 본문 바로가기 회사정보 바로가기

정부, 카카오에 서비스 다중화 요구…"1개월내 조치 계획 보고"

과기정통부, 카카오 먹통 사태 조사 결과 발표…배터리 발화 원인은 아직
SK C&C·카카오·네이버에 1개월 내 주요 사고 원인 개선 조치 및 계획 보고 요구

(서울=뉴스1) 이기범 기자 | 2022-12-06 14:00 송고
김범수 카카오미래이니셔티브센터장이 지난 10월24일 서울 여의도 국회에서 열린 과학기술정보방송통신위원회의 과학기술정보통신부 등에 대한 종합감사에 출석해 데이터센터 화재로 인한 카카오 먹통 사태에 대해 사과하고 있다. 2022.10.24/뉴스1 © News1 유승관 기자
김범수 카카오미래이니셔티브센터장이 지난 10월24일 서울 여의도 국회에서 열린 과학기술정보방송통신위원회의 과학기술정보통신부 등에 대한 종합감사에 출석해 데이터센터 화재로 인한 카카오 먹통 사태에 대해 사과하고 있다. 2022.10.24/뉴스1 © News1 유승관 기자

정부가 카카오 먹통 사태와 관련해 카카오 측에 서비스 다중화를 요구했다.

과학기술정보통신부는 6일 방송통신위원회, 소방청과 함께 지난 10월15일 SK C&C 판교 데이터센터 화재 및 카카오·네이버 등 부가통신서비스 장애에 대한 조사 결과를 발표했다.
이번 조사 결과에 따르면 15일 오후 3시19분 SK C&C 판교 데이터센터 지하 3층 배터리실에 화재가 발생해 같은 날 오후 11시45분에 완전히 진화됐으며, 화재 진압, 건물 전력 차단 등을 이유로 카카오, 네이버 등 입주 기업 서비스에 장애가 발생했다.

카카오는 장애 복구에 127시간33분이 소요됐으며, 네이버는 일부 기능 오류가 발생해 주요 서비스 및 기능은 약 20분~12시간 내 정상화됐다.

◇배터리 발화 원인은 아직, 카카오 이중화 조치 미흡 지적돼

이번에 발표된 조사 결과는 기존에 공개된 내용과 크게 다르지 않다.
과기정통부는 SK C&C 판교 데이터센터의 경우 배터리 모니터링 시스템(BMS)에서 화재 징후가 없었던 상황에서 지하 3층 내 배터리실에서 발화가 시작됐고, 리튬이온 배터리가 일부 무정전 전원 장치(UPS)와 물리적으로 완벽히 분리되지 않은 공간에 배치돼 화재 열기 등으로 UPS 작동이 중지, 일부 전원공급이 중단됐다고 설명했다.

이어 화재 진압을 위한 살수 시 누전 등 2차 피해 우려로 전체 전력이 차단됐다.

과기정통부는 "살수가 필요한 상황에서 살수로 인한 2차 피해가 우려되는 특정 구역 및 차단 스위치를 단시간 내 식별할 수 없어 선별적 차단 조치가 이뤄지지 못했다"며 "화재 대비 매뉴얼은 있었으나 살수 상황, 발화 구역 등 실제 화재 상황 수준까지 반영한 세부 대응계획 및 모의훈련은 없었다"고 덧붙였다.

배터리 발화 원인은 아직 경찰과 소방당국, 국립과학수사연구원이 조사를 진행 중이다.

카카오는 서비스 기능을 5개 레이어로 구분하고 판교 데이터센터와 기타 센터 간 동작(Active)-대기(Standby) 체계로 이중화했지만, 이번 사고에서는 대기 시스템이 제대로 동작하지 못했다. 대기 서버를 활성화하기 위한 '운영 및 관리도구'가 판교 데이터센터 내에서만 이중화돼 서비스 장애 복구가 지연된 것으로 분석됐다.

또 이미지·동영상 송수신 시스템 등 일부 서비스 구성 요소가 데이터센터 간 이중화돼 있지 않아 복구에 많은 시간이 걸렸다.

카카오톡, 다음, 카카오인증 등 카카오 서비스 핵심 기능이 판교 데이터센터에 집중돼 이번 사태를 키웠다는 지적도 이어졌다.

이와 함께 장애 탐지·전파·복구 등 단계별 체계화 및 자동화가 미흡했다는 점, 이번 같은 대형 재난 상황에 대비가 부족했다는 점 등이 문제로 지적됐다.

네이버는 데이터센터 간 이중화 조치로 서비스 중단은 없었지만, 타 데이터센터로 서비스 전환 과정에서 쇼핑, 뉴스 등 일부 서비스 기능에서 오류가 발생한 것으로 확인됐다.

과기정통부 관계자는 "현장 조사, 대책반 전문가 논의를 통해 검증한 내용 위주로 발표가 됐다. 사실을 확인하고 장기적으로 조치했으면 하는 부분 등이 담겼다"며 "발화 원인 수사는 별개로 경찰과 소방당국, 국과수가 분석 중인데 시간이 오래 걸릴 것으로 보인다"고 밝혔다.

지난 10월15일 오후 경기 성남시 분당구 삼평동 SK판교캠퍼스에서 불이나 소방대원들이 현장을 살피고 있다. 이날 오후 카카오 등 데이터 관리 시설이 입주해있는 이 건물 지하에서 불이나면서 카카오톡, 카카오택시 등 일부서비스에 장애가 빚어지고 있다. 한 휴대폰에 다음 홈페이지 오류 안내가 뜨고 있다. 2022.10.15/뉴스1 © News1 박세연 기자
지난 10월15일 오후 경기 성남시 분당구 삼평동 SK판교캠퍼스에서 불이나 소방대원들이 현장을 살피고 있다. 이날 오후 카카오 등 데이터 관리 시설이 입주해있는 이 건물 지하에서 불이나면서 카카오톡, 카카오택시 등 일부서비스에 장애가 빚어지고 있다. 한 휴대폰에 다음 홈페이지 오류 안내가 뜨고 있다. 2022.10.15/뉴스1 © News1 박세연 기자

◇카카오에 서비스 이중화 요구…1개월 내 개선 조치 보고

정부는 SK C&C, 카카오, 네이버에 1개월 이내 주요 사고 원인에 대한 개선 조치와 향후 계획을 수립해 보고하도록 할 계획이라고 밝혔다.

카카오에는 서비스 다중화, 재난대비 훈련 조치, 서비스 장애 발생 시 이용자 고지 및 피해 구제 체계 마련 등을 요구했다.

이번 서비스 장애 복구 지연 핵심 원인으로 꼽히는 '운영 및 관리도구'를 여러 데이터센터로 다중화하도록 했고, 서비스 핵심 기능에 대해선 우선순위를 고려해 현재보다 높은 수준의 분산 및 다중화를 적용할 수 있는 방안을 수립하도록 했다.

또 데이터센터 전소, 네트워크 마비 등 최악의 상황을 가정한 훈련 계획을 수립·시행하고 보고하도록 요구했다. 장애 탐지-전파-복구 등 전 단계 복구 체계를 재점검해 자동화 기능을 적용하는 등 개선 방안을 수립하도록 했다.

SK C&C 측에는 데이터센터 화재 예방·탐지, 데이터센터 전력공급 생존성 확보 등을 요구했다. 다양한 화재 감지 시스템 구축 방안을 수립하고, 리튬이온 배터리 화재 상황에 대한 대안을 마련하도록 했고, 지속적인 데이터센터 전력 공급을 위해 배터리와 기타 전기설비 간 물리적 공간을 분리하고, 배터리실 내 위치한 전력선을 재배치해 구조적 안정성을 확보하도록 했다.

또한 화재 등 재난 발생 구역의 전력을 개별 차단할 방안을 마련하고 재난 현장에 직접 진입하지 않고도 해당 구역 전력을 차단할 수 있는 조치를 마련하도록 했다. 아울러 재난 대응 시나리오 개발 및 세부 훈련 계획을 수립해 모의 훈련을 실시하고 보고하도록 했다.

네이버에는 장애 시나리오별 복구 방안 재점검, 데이터센터 전소 상황 모의 훈련 등을 요구했다.

국회 과방위에 출석한 김범수 카카오 미래이니셔티브센터장(왼쪽부터), 최태원 SK 회장, 이해진 네이버 글로벌투자책임자(GIO). 2022.10.24/뉴스1 © News1 이재명 기자
국회 과방위에 출석한 김범수 카카오 미래이니셔티브센터장(왼쪽부터), 최태원 SK 회장, 이해진 네이버 글로벌투자책임자(GIO). 2022.10.24/뉴스1 © News1 이재명 기자

과기정통부는 각 사가 제출한 조치 결과, 향후 계획 및 재난예방·복구에 대한 의견 등을 정책 방안에 반영해 내년 1분기 중으로 디지털 서비스 안정성 확보를 위한 종합 개선 방안을 수립할 계획이다.

한편 카카오는 지난 10월19일부터 11월6일까지 10만5116건의 피해를 접수했으며, 이 중 유료 서비스 피해는 1만4918건, 금전적 피해를 언급한 무료 서비스는 1만3198건이 접수됐다고 밝혔다.

이종호 과기정통부 장관은 "정부는 이번 사고를 계기로 주요 디지털 서비스에 대한 재난대응체계를 원점에서 재검토하고 각 사업자별 개선방안, 점검 결과, 제도개선 등을 종합하여 디지털 시대에 맞는 안정성 강화방안을 마련함으로써 끊김 없는 디지털 서비스를 제공할 수 있는 확고한 디지털 위기관리 체계를 구축해나가겠다"고 말했다.



Ktiger@news1.kr

이런 일&저런 일

    더보기