主要观点:2024 年 7 月 19 日 CrowdStrike 为 Windows 传感器发布内容配置更新导致系统崩溃,截至 7 月 29 日 8 点约 99%的 Windows 传感器已恢复在线,道歉并采取多项措施改进以防止类似情况再次发生。
关键信息:
- 7 月 19 日更新内容致系统 crash,7 月 29 日大部分系统恢复,通常传感器连接周环比有 1%波动。
- 新传感器能力开发测试符合标准,7 月更新致内存读取越界致系统 crash,第三方审查确认该 bug 不可被威胁利用。
- 采取多项措施改进,如更新内容配置系统测试程序、增加部署层和验收检查等。
- 发布根因分析报告及执行摘要,提供更多关于事件细节及后续改进措施。
- CEO 感谢客户和合作伙伴努力,承诺提供透明度并继续改进。
- 解答常见问题,包括事件发生原因、已采取和未来将采取的措施等。
重要细节: - 传感器更新方式包括传感器内容和快速响应内容,此次事件涉及快速响应内容更新的 bug。
- 详细阐述测试和部署流程,包括模板类型、实例等的测试和发布。
- 介绍多种修复和补救措施,如重启主机、构建自动化恢复 ISO、手动过程等,以及针对不同环境的修复指导。
- 提供相关技术分析、新闻报道、词汇表等额外资源。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。