[이성엽의 IT프리즘]MS 발 글로벌 클라우드 대란의 교훈
(서울=뉴스1) 이성엽 고려대 기술경영전문대학원 교수/기술법정책센터장 = 지난 7월 19일 전 세계적인 IT 시스템 장애로 세계 주요 항공사, 금융기관, 병원 등에서 서비스가 중단되는 피해가 발생했다. 역사상 최악의 IT 대란으로 평가되는 사태는 세계 1위 보안기업인 크라우드스트라이크사의 보안제품 '팰컨(Falcon)'의 최신 업데이트 시 MS사의 윈도우 시스템을 비정상적으로 종료시키는 등의 장애를 일으킨 것이 원인이었다. 팰컨은 네트워크가 연결되는 장치인 PC, 스마트폰, IoT 장치 등의 사이버 위협을 실시간으로 탐지하고 식별된 위협에 대응하여 피해를 방지하는 기능을 가진 보안 SW이다.
이번 대란 초기에는 MS 클라우드 서비스인 애저(Azure)의 장애로 알려졌으나, 크라우드스트라이크사 제품이 MS사의 윈도우에 장애를 일으킨 것이 사안의 본질로 밝혀졌다. 이번 사태로 인해 미국 주요 항공사, 독일 베를린 공항, 런던 증권 거래소 등 항공·방송·금융·의료 분야 전 세계 주요 서비스에 장애가 발생했는데, 크라우드스트라이크사 고객이 전 세계 2만 4000여 개로 방대하기 때문에 피해 규모도 광범위했다.
국내에서도 저비용 항공사 발권·예약 시스템 및 온라인 게임 서비스 등 크라우드스트라이크 사의 10개 고객사의 운영 시스템에 장애가 발생하였으나, 해외에 비해 피해 규모는 상대적으로 적은 것으로 파악됐다. 한국이 피해가 적었던 이유는 한마디로 문제가 된 보안 SW의 사용이 적었기 때문이다. 공공부문의 경우 크라우드스트라이크사의 팰컨 제품은 공공분야 진출을 위한 클라우드 보안 인증(CSAP)을 취득하지 않아 국내 공공시장에는 진출하지 않은 상태였고, 민간부문은 지니언스, 안랩 등 국내 보안솔루션 사용이 많고 크라우드스트라이크사 제품 사용은 저조했다.
이번 대란을 두고 몇 가지 논쟁이 벌어지고 있다. 첫째, 클라우드의 유용성에 관한 논쟁이다. 클라우드란 구름(cloud)과 같이 무형의 형태로 존재하는 하드웨어·소프트웨어 등의 컴퓨팅 자원을 전기, 수도와 같이 필요한 만큼 쓰고 이에 대한 요금을 지급하는 서비스다. 한마디로 “인터넷을 이용한 IT 자원의 주문형 아웃소싱 서비스”다. 다만, 이런 집중화된 데이터 시스템으로 인해 클라우드 자체나 클라우드에 연결된 SW 제품의 장애가 발생하면 클라우드 이용 시스템 전체의 장애가 나타나기 때문에 과연 클라우드가 최선인가 하는 것이다.
그러나 기업들이 클라우드를 사용하는 이유는 자체적으로 서비스를 유지하는 것보다 비용이 저렴하고 서비스 안정성이 높기 때문이다. 또한 자체적으로 구축하는 것보다 재해 복구도 용이하다.
결론적으로 클라우드는 서버의 구매, 설치, 유지 비용, 소프트웨어 구매 비용, 데이터 손실 위험도 줄일 수 있는 장점을 넘어, 양질의 데이터를 대량으로 수집·저장·처리하고, 이를 활용한 우수한 AI 서비스의 공급을 위한 가치사슬에서 중요한 연결 고리라는 점에서 클라우드로의 전환은 거부할 수 없는 대세라고 봐야 할 것이다. 또한 이번 사건은 사실 클라우드 자체 요인으로 인한 장애도 아니었다는 점을 상기할 필요가 있다.
둘째, 이번 대란을 방지할 수 있는 대안의 하나로 거론되는 멀티클라우드 전략에 관한 것이다. 이는 기업이 둘 이상의 클라우드 업체를 이용하는 전략을 말한다. 단일 클라우드 업체에 의존하는 대신 여러 클라우드 환경을 혼합해 사용하는 방식으로 이로 인해 하나의 클라우드의 장애가 발생하더라도 다른 클라우드로 신속히 전환할 수 있어 리스크를 분산시킬 수 있다. 정부도 클라우드 대란을 계기로 네이버, 카카오, 쿠팡 등 부가통신사업자에게 단일 클라우드 기반이 아닌 2개 이상의 클라우드 기반 주요 서비스의 다중화 권고 등의 내용을 담은 통신재난관리기본계획 수립지침을 의결했다. 다만, 멀티클라우드는 추가적인 비용을 수반하는 만큼 데이터의 중요도에 따라 중요한 데이터는 자체 서버에, 나머지 데이터는 클라우드에 보관하는 하이브리드 전략도 고민할 필요가 있을 것이다.
셋째, 이번 대란과 망 분리 규제와의 관계에 관한 것이다. 망 분리는 기업 보안을 위해 내부 업무망과 일반 인터넷망을 분리하는 것을 말한다. 크게 컴퓨터 두 대를 쓰는 물리적 망 분리와 컴퓨터 한 대에 인터넷용 가상 컴퓨터를 구현하는 논리적 망 분리로 나뉜다. 국내에서는 금융을 비롯한 공공 부분에 망 분리 규제가 시행되고 있는데, 망 분리가 외부 침입을 차단하는 실효적인 방법일 수 있지만, 외부 클라우드와 연계하는 서비스형 소프트웨어(SaaS)를 사용할 수 없는 등 업무 생산성을 제한하고 IT 활용을 저해해 혁신을 가로막고 있는 문제에 있어, 정부도 이에 대한 규제 완화를 추진 중이다. 공공분야에서 망 분리 규제와 낮은 외산 클라우드 의존도가 이번 대란의 피해를 줄인 점은 인정되지만, 그렇다고 이를 계기로 장점보다는 단점이 부각되고 있는 망 분리를 지속할 명분을 찾아서는 안 될 것이다.
넷째, 국내 클라우드 우선 전략 내지 소위 소버린 클라우드(sovereign cloud) 전략에 관한 논쟁이다. 이번 대란이 MS라는 글로벌 기업 서비스에서 장애가 발생한 만큼, 한국에 특화된 소버린 클라우드가 대안으로 거론되고 있다. 소버린 클라우드란 특정 국가가 자국의 법률과 규정에 따라 데이터를 독립적으로 관리하는 클라우드 컴퓨팅 서비스를 말한다.
올해 1분기 기준 글로벌 클라우드 시장 점유율은 AWS 31%, MS 25%, 구글 11% 등 빅테크 기업의 시장 점유율이 70%에 달하고 있으며, 한국의 경우에도 과학기술정보통신부 '2023년 부가통신사업 실태조사 결과' 조사에 따르면 클라우드 서비스 제공사 이용 플랫폼은 AWS(60.2%), MS 애저(24%), 네이버클라우드(20.5%), 구글(19.9%) 순이었다. 이처럼 글로벌 빅테크의 시장 독과점 상황에서 국내 클라우드로 멀티 시스템을 구축하면 글로벌 빅테크 기업이 업데이트 결함 등의 문제를 일으키더라도 서비스 안전성을 높일 수 있으며, 또한 사고 발생 시 긴급 대응에도 유리한 측면이 있다. 다만, 국내 기업이 소버린 클라우드를 선택하기 위해서는 국내 클라우드 기업의 기술, 품질이 글로벌 기업에 뒤처지지 않도록 국내 클라우드 산업의 경쟁력을 향상시키기 위한 전략이 필요하다.
이번 대란은 글로벌 초연결 사회의 민낯을 보여주었다. 연결이 확대될 수 있도록 이로 인한 장애와 뒤이은 피해의 규모도 증가한다는 점을 여실히 보여주었다. 또한 사이버 시큐리티 확보 여부가 국가사회의 기본 인프라의 안정성을 좌우할 수 있다는 점을 다시 한번 깨닫게 해 준 계기였다. 사실 이번 사건만 보면 클라우드 업체나 관련 기업이 새로운 기능을 업데이트하는 패치 작업 전에 사전 테스트를 통해 장애 발생 여부 등 영향 분석을 수행하는 관리체계를 준수하는 것이 필수적이라는 것을 확인한 것이 일차적인 교훈이다. 정부도 보안 SW 등 타사의 제품 도입 및 업데이트 시 모의시험 환경에서 사전 검증을 적용하도록 통신재난관리기본계획 수립지침을 의결했다. 다만 이에 더해 글로벌 빅테크에 종속된 국내 클라우드 시장에서 국산 클라우드의 경쟁력 강화와 데이터 주권의 확보를 위한 정책 방안에 대한 고민도 계속돼야 할 것이다.
Copyright ⓒ 뉴스1. All rights reserved. 무단 전재 및 재배포, AI학습 이용금지.