从 CrowdStrike 中断事件中汲取的 8 个业务连续性教训

主要观点:2024 年 7 月 CrowdStrike 中断事件给全球企业带来巨大冲击,导致运营瘫痪和服务下线,其因 EDR 解决方案的错误更新而起,已成为 EDR 中断影响预防的典型案例。此事件促使各组织重视业务连续性规划,从中汲取多方面教训并转化为行动策略。
关键信息

  • 该事件影响超 800 万 Windows 设备,引发全球范围的灾难恢复计划启动。
  • 第三方故障是组织触发危机响应的第二常见原因,识别和映射第三方依赖关系至关重要。
  • 冗余和故障转移对 BCP 策略很重要,包括架构冗余、多种故障转移方法及自动化。
  • 事件中组织的事件响应和沟通协议存在差距,需加强相关计划和培训。
  • 许多公司的 BCP 和备份策略过时,定期测试和从过去事件中学习很重要。
  • 要监控法规和合规要求,保持合规性。
  • 培养抗灾和学习文化,鼓励团队参与回顾和分享经验。
  • 利用自动化实现更快恢复,避免手动过程的弊端。
  • 评估过度依赖单一供应商的风险,采用多样化防御策略。
    重要细节
  • Microsoft 称 CrowdStrike 中断影响超 800 万 Windows 设备,从航班停飞到医疗系统中断。
  • 中小型实体停机每小时需近 25000 美元,架构冗余可防止单点故障。
  • 报告发现 88%领导者预计类似事件会再次发生,应急响应计划应涵盖多个环节。
  • 仅 47%IT 领导者定期测试备份选项,测试方法包括模拟和演练。
  • 法律和行业框架要求 BCP 和灾难恢复协议,需详细记录。
  • 45%企业预计未来五年有技能差距,要促进内部抗灾能力。
  • 手动恢复过程会导致恢复时间延长和错误增加,自动化可减轻负担。
  • 过度依赖单一供应商风险大,需采用多样化策略和进行风险评估。
阅读 48
0 条评论