小亦平台会持续给大家科普一些运维过程中常见的问题解决案例,运维朋友们可以在常见问题及解决方案专栏查看更多案例。
1. 问题概述
2024年1月26日,某银行测试环境的应用出现Redis连接异常,具体表现为无法获取集群节点信息。排查发现Redis日志在特定时间段内缺失,且从节点全部关闭,导致集群高可用性失效。
2. 问题分析
分析过程:
- 应用日志检查:发现应用连接Redis时抛出cluster nodes获取异常。
- Redis日志排查:2024/1/26 17:40至21:15期间无日志记录,无法直接判断Redis状态。集群负载正常,但监控缺失,无法追溯历史状态。
- 集群状态检查:主节点运行正常,但所有从节点(Slave)均处于关闭状态。
分析结论:
- Redis集群在故障时间段内可能因从节点未启动导致高可用性失效,且日志与监控缺失加剧了问题定位难度。
- 解决方案与优化建议
优化措施:建议启动从节点,保持redis高可用。
如果您遇到类似问题或有其他疑问,欢迎提交工单:https://www.ces-xiaoyi.com.cn/#/workOrder?marketing_code=arti... 小亦平台运维团队将为您提供专业支持!
解锁小亦平台的更多功能:
小亦平台AI巡检Agent现已正式开放!🌟三步实现智能运维,get专业巡检报告:https://www.ces-xiaoyi.com.cn/#/next_console/console/workbenc...
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。