Netflix 开源 Chaos Monkey 和 Asgard 项目
Netflix 近期开源了其备受关注的 Chaos Monkey 软件,该软件通过故意使服务器下线来测试云环境的弹性。这是 Netflix 一系列内部开发工具中的又一个,这些工具被免费分享给技术社区。
Chaos Monkey 的背景与功能
- 背景:Netflix 团队在 2010 年 12 月通过一篇博客文章首次介绍了 Chaos Monkey,解释了在 AWS 云上托管其广受欢迎的视频流服务时学到的经验。其中一个关键教训是“避免失败的最佳方法是不断失败”,即通过主动破坏环境来发现潜在的故障点。
- 功能:Chaos Monkey 的任务是随机终止架构中的实例和服务,以确保系统在意外故障时仍能正常运行。
Chaos Monkey 的开源与配置
- 开源:2012 年 7 月 30 日,Netflix 技术团队宣布将 Chaos Monkey 作为开源项目发布,适用于除 AWS 之外的其他云环境。
配置:
- 运行时间:默认在非假日的周一至周五上午 9 点至下午 3 点运行,以确保有支持人员在旁解决问题。
- 应用范围:用户可以选择 Chaos Monkey 对新应用的攻击性,Netflix 选择对所有应用运行 Chaos Monkey,但其他用户可以选择仅对特定应用运行或设置较低的实例终止概率。
Asgard 项目的介绍
- 背景:在 Chaos Monkey 开源之前,Netflix 还开源了 Asgard 项目,这是一个用于部署和管理 AWS 环境的 Web 界面。
功能:
- 应用管理:Asgard 通过 SimpleDB 中的应用注册表和命名约定,将多个云对象与单个应用关联,简化了 AWS 管理。
- 集群管理:将 AWS 自动扩展组聚合为“集群”对象,便于在部署失败时回滚。
Netflix 的开源战略
- 整体计划:Chaos Monkey 和 Asgard 是 Netflix 积极开源软件以帮助更广泛社区的一部分。
- 其他项目:Netflix 的所有开源项目都可以在其 GitHub 页面上查看。
通过这些开源项目,Netflix 不仅展示了其在云环境管理方面的创新,还为技术社区提供了宝贵的工具,帮助其他公司提升其云环境的弹性和管理效率。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。