随着分布式架构、微服务和云原生技术的广泛应用,传统的静态测试和被动响应机制已无法满足现代IT环境下的稳定性需求。系统中潜在的故障点和风险区域如果不能被及时发现和修复,可能在关键业务时刻引发连锁反应,造成严重的服务中断和经济损失。为应对这些挑战,基于混沌工程的主动故障注入和混沌实验场景设计方法论正成为行业最佳实践。秉承"在生产环境故障发生前发现并解决问题"的理念,推出了3.2.0版本的混沌工程平台,融合快速实验功能、大模型智能分析和丰富的故障注入能力。该版本的平台可降低混沌工程场景设计及实施门槛,赋能企业IT团队在真实环境下验证系统韧性,识别潜在风险点,并借助AI能力提供专业化修复建议。
新增功能亮点
新增快速实验功能:基于混沌工程XYZ场景设计方法论,降低平台使用门槛。支持基于用户配置的应用系统信息,自动生成的测试场景,一键创建实验计划,并自动带入故障对象和故障配置参数,可一键执行实验计划。
故障对象:
管理快速场景生成所需要的微服务信息。在后续添加快速场景生成信息时,作为故障注入的对象进行选择 提供对kubernetes环境以及传统主机环境部署的应用及其对应微服务进行部署信息的录入管理;支持批量导入、导出kubernetes环境以及传统主机环境部署的应用信息。
场景生成:
支持选择应用下多个故障对象,以及多个内置通用故障;提供针对每个故障对象与故障对应的组合测试场景,并自动带入场景默认配置参数,同时支持对场景参数的个性化配置;提供场景生成计划,可依据混沌场景设计方法论自动生成所有组合测试场景
快速场景:
提供按照kubernetes环境以及传统主机环境自动生成场景的分类查询、按应用搜索、名称搜索等;支持查看场景生成任务下对应生成的所有组合测试场景;支持从自动生成的测试场景一键创建实验计划,并自动带入所属应用、场景配置参数,可一键执行实验计划
大模型协助分析应用系统风险点:
在平台实验记录及实验报告中与大模型对话,协助分析实验结果中发现的风险点及给出建议的解决方案,实现对复杂分布式系统弹性的全面评估。该过程中,大模型能够基于用户输入的当前实验记录信息,对系统瓶颈进行多维度定位,并提供具有可行性的针对性修复建议,例如架构优化方案、容错机制改进和资源配置调整等。
Java应用故障增加规则匹配有效性验证:
可对多个类/方法故障同时注入,并在事件中包含相应类/方法匹配规则的有效性验证,便于快速验证故障是否注入成功。
总结
- 增强实验验证能力:增加规则匹配有效性验证,判断故障是否成功注入,减少误判
- 大模型智能分析实验:AI辅助分析实验结果,提供专业化见解,减少人为分析偏差
- 实验场景自动生成:基于混沌工程场景设计方法论,上传实验对象信息后,自动生成实验场景,减少人工配置
- 打通多平台数据流:统一CMDB模型,打通基于one架构基座的多平台的数据流
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。