본문 바로가기
IT뉴스

글로벌 IT 장애 대란 - MS클라우드에 어떤 일이 ?

by romydady 2024. 7. 20.

2023.04.11 - [기업 분석] - 크라우드스트라이크(CrowdStrike) 기업 소개, 연혁 및 전망, CEO

 

크라우드스트라이크(CrowdStrike) 기업 소개, 연혁 및 전망, CEO

크라우드스트라이크 기업 소개 크라우드스트라이크(CrowdStrike)는 클라우드 기반 보안 솔루션을 제공하는 보안 기업입니다. 최첨단 보안 기술을 사용하여 이상 징후를 탐지하고, 악성 코드를 차

romyismycat.tistory.com

 

마이크로소프트의 Azure 클라우드 서비스가 전 세계적으로 중단되었습니다. 이로 인해 한국에서는 10개 기업이 영향을 받았으나, SK텔레콤, KT, LG U+, 네이버, 카카오와 같은 주요 통신사 및 인터넷 기업은 피해를 입지 않았습니다. 문제의 원인은 CrowdStrike의 소프트웨어 업데이트로 인한 "블루 스크린" 오류였습니다. 정부는 긴급 대응팀을 구성하고, 사용자에게 안전 모드에서 문제의 파일을 삭제할 것을 권장하고 있습니다

MS 클라우드 서비스 문제의 원인 및 장애 개요

  • CrowdStrike의 소프트웨어 업데이트: CrowdStrike는 보안 소프트웨어를 제공하는 회사로, 최근 업데이트가 Azure 클라우드 서비스에 영향을 미쳤습니다. 이 업데이트로 인해 시스템이 불안정해지고, 블루 스크린 오류가 발생했습니다. 
  • 정부의 대응: 정부는 이 문제를 해결하기 위해 긴급 대응팀을 구성하고, 사용자들에게 안전 모드에서 문제의 파일을 삭제하라고 권장하고 있습니다
  • CrowdStrike 소개: CrowdStrike는 클라우드 기반의 보안 솔루션을 제공하는 기업으로, 엔드포인트 보호 및 위협 탐지 기능을 갖춘 소프트웨어를 개발하고 있습니다. 이 회사의 제품은 기업들이 사이버 공격으로부터 보호받을 수 있도록 돕습니다. 
  • 소프트웨어 업데이트의 중요성: CrowdStrike의 소프트웨어 업데이트는 보안 기능을 강화하기 위한 것이었으나, 예상치 못한 오류를 초래하여 MS 클라우드 서비스에 큰 영향을 미쳤습니다. 

장애 개요

  • 장애 발생 원인: CrowdStrike Falcon 콘텐츠 업데이트로 인한 문제로, 악의적인 사이버 활동과는 무관합니다.
  • 영향 받는 시스템: Windows 10 및 이후 버전의 시스템에 영향을 미치며, Mac 및 Linux 호스트는 영향을 받지 않습니다.
  • 해결 진행 상황: CrowdStrike는 문제를 식별하고 격리했으며, 수정 패치를 배포했습니다. 고객 조직은 CrowdStrike의 지침과 고객 포털을 참조하여 문제를 해결해야 합니다.

보안경고

  • CISA(미국 사이버 보안 및 인프라 보안국)는 이 사건을 악용하여 피싱 및 기타 악의적인 활동을 시도하는 위협 행위자들이 관찰되었다고 경고했습니다.
  • CISA는 조직과 개인에게 경계를 유지하고, 합법적인 출처의 지침만 따를 것을 권장합니다.
  • 직원들에게 피싱 이메일이나 의심스러운 링크를 클릭하지 않도록 상기시킬 것을 권장합니다.

 

이번 사건은 MS 클라우드 서비스와 CrowdStrike 간의 관계를 잘 보여줍니다. CrowdStrike의 소프트웨어 업데이트가 MS 클라우드 서비스의 중단을 초래했으며, 이는 많은 기업과 사용자에게 영향을 미쳤습니다. 이러한 사건은 클라우드 서비스의 안정성과 보안 업데이트의 중요성을 다시 한번 일깨워줍니다.

CrowdStrike의 소프트웨어 업데이트가 원인 제공

  • 업데이트의 목적: CrowdStrike는 사이버 보안 솔루션을 제공하는 기업으로, 이번 업데이트는 보안 기능을 강화하기 위한 것이었습니다. 그러나 이 업데이트가 예상치 못한 오류를 초래하여 시스템의 불안정을 야기했습니다. 
  • 결함 있는 소프트웨어 업데이트: CrowdStrike의 Falcon Sensor에 대한 결함 있는 업데이트가 Windows 컴퓨터 시스템을 충돌시키는 원인이 되었습니다. 이로 인해 전 세계적으로 많은 기업과 기관에서 IT 장애가 발생했습니다. 
  • Microsoft와의 연관성: CrowdStrike의 소프트웨어는 Microsoft의 Windows 운영 체제와 밀접하게 통합되어 있습니다. 따라서 이 업데이트로 인해 Microsoft 365 서비스에 광범위한 장애가 발생했습니다.
  • 문제의 원인: 업데이트 후, 많은 시스템에서 블루 스크린 오류가 발생하였고, 이는 클라우드 서비스의 중단으로 이어졌습니다
  • Microsoft의 대응: Microsoft는 장애 발생 후 신속하게 문제를 해결하기 위해 노력하고 있으며, 사용자들에게 상황을 알리고 있습니다. 
  • CrowdStrike의 조치: CrowdStrike는 문제를 인지하고, 사용자들에게 추가적인 지침을 제공하고 있습니다. 이들은 특정 환경에서의 영향을 최소화하기 위한 조치를 취하고 있습니다. 

 

CrowdStrike의 소프트웨어 업데이트는 보안 기능을 강화하기 위한 것이었지만, 결함으로 인해 전 세계적으로 IT 장애를 일으켰습니다. 이 사건은 소프트웨어 업데이트의 중요성과 그로 인한 잠재적 위험을 다시 한번 상기시켜 줍니다. 앞으로 이러한 문제가 재발하지 않도록 각 기업과 기관이 더욱 철저한 검토와 테스트를 진행해야 할 것입니다.

CrowdStrike 공식 리포트 (2024.7.22)

2024년 7월 19일, CrowdStrike 센서 업데이트가 전 세계적으로 Windows 시스템에서 시스템 충돌과 블루스크린(BSOD)을 유발했습니다.

사건 개요

  • 발생 일시: 2024년 7월 19일 04:09 UTC
  • 영향을 받은 시스템: Falcon 센서 버전 7.11 이상을 사용하는 Windows 시스템
  • 문제의 원인: 센서 구성 업데이트로 인한 논리 오류
  • 수정 일시: 2024년 7월 19일 05:27 UTC
  • 영향을 받지 않은 시스템: Linux 및 macOS 시스템

영향

  • 2024. 07. 19 04:09 UTC와 05:27 UTC 사이에 온라인 상태였던 Windows 7.11 이상 버전의 Falcon 센서를 실행하는 시스템이 영향을 받았습니다.
  • 전 세계적으로 약 850만 대의 Windows 장치가 영향을 받았습니다.
  • 항공, 의료, 금융 등 다양한 분야에서 서비스 중단이 발생했습니다.

근본 원인

  • 업데이트된 채널 파일(C-00000291-*.sys)의 논리 오류가 문제를 야기했습니다.
  • 이 파일은 Windows 시스템에서 명명된 파이프 실행을 평가하는 역할을 합니다.
  • 업데이트는 사이버 공격에 사용되는 새로운 악성 명명된 파이프를 대상으로 하기 위한 것이었지만 오류를 도입했습니다.

CrowdStrike의 대응

  • 채널 파일의 논리 오류는 수정되었습니다.
  • 이 파일에 대한 추가 변경은 계획되어 있지 않습니다.
  • CrowdStrike은 유사한 사건을 방지하기 위해 철저한 근본 원인 분석을 진행하고 있습니다.
  • 해결 방법은 CrowdStrike 블로그 및 지원 포털에서 확인할 수 있습니다.

결론적으로, CrowdStrike의 잘못된 구성 업데이트로 인해 전 세계적인 시스템 장애가 발생하여 수백만 대의 장치에 영향을 미치고 여러 산업 분야에서 서비스 중단을 초래했습니다.

장애 대란으로부터의 교훈

최근 발생한 크라우드스트라이크-마이크로소프트 장애 사고는 조직이 특정 제조사의 보안 솔루션에 의존할 때 겪는 여러 중요한 문제점을 드러냈습니다.

공급업체 집중 위험

  • 보안 스택 다양화: 단일 공급업체에만 의존하면 치명적인 결과를 초래할 수 있습니다.
  • 강력한 사고 대응 계획 개발: 주요 공급업체로 인해 발생한 대규모 장애 사고로부터 복구하는 방법을 이해합니다.
  • 정기적인 비즈니스 연속성 및 복구 훈련 수행: 계획이 효과적인지 확인하기 위해 훈련을 실시합니다.

엄격한 테스트의 중요성

  • 공급업체 QA를 맹신하지 마십시오: 업데이트나 새 소프트웨어를 배포하기 전에 철저한 테스트를 수행해야 합니다.
  • 보안 플랫폼을 깊이 이해합니다: 잠재적인 위험을 식별하기 위해 작동 방식을 파악해야 합니다.
  • 공급업체와 협력: 가동 중단 방지를 위한 제어 장치를 논의하고 테스트 프로세스를 이해해야 합니다.

단일 공급업체에 대한 과도한 의존

  • 신뢰를 점차적으로 구축: 단일 공급업체에 지나치게 의존하지 않아야 합니다.
  • 대규모 장애 사고의 잠재적 영향 고려: 주요 장애의 결과를 평가해야 합니다.
  • 대비 계획 개발: 비상 상황에 대비하여 대체 솔루션을 준비해야 합니다.

본질적으로 이번 장애 사고는 사이버 보안에 대한 보다 적극적이고 다양화된 접근 방식의 필요성을 강조했습니다. 조직은 주요 보안 제공업체로 인해 발생하는 서비스 중단에 대응할 준비가 되어 있어야 하며 대비 계획을 마련해야 합니다.

 

반응형

댓글