头图

小亦平台会持续给大家科普一些运维过程中常见的问题解决案例,运维朋友们可以在常见问题及解决方案专栏查看更多案例。

1. 问题概述

2024年1月26日,某银行测试环境的应用出现Redis连接异常,具体表现为无法获取集群节点信息。排查发现Redis日志在特定时间段内缺失,且从节点全部关闭,导致集群高可用性失效。image.png
2. 问题分析

分析过程:

  1. 应用日志检查:发现应用连接Redis时抛出cluster nodes获取异常。image.png
  2. Redis日志排查:2024/1/26 17:40至21:15期间无日志记录,无法直接判断Redis状态。集群负载正常,但监控缺失,无法追溯历史状态。image.png
  3. 集群状态检查:主节点运行正常,但所有从节点(Slave)均处于关闭状态。

分析结论:

  • Redis集群在故障时间段内可能因从节点未启动导致高可用性失效,且日志与监控缺失加剧了问题定位难度。
  • 解决方案与优化建议
    优化措施:建议启动从节点,保持redis高可用。
    image.png
    image.png
    image.png

如果您遇到类似问题或有其他疑问,欢迎提交工单:https://www.ces-xiaoyi.com.cn/#/workOrder?marketing_code=arti... 小亦平台运维团队将为您提供专业支持!

解锁小亦平台的更多功能:

小亦平台AI巡检Agent现已正式开放!🌟三步实现智能运维,get专业巡检报告:https://www.ces-xiaoyi.com.cn/#/next_console/console/workbenc...


小亦智能运维
1 声望0 粉丝

小亦智能运维平台是中亦科技基于20年深耕运维行业经验结合大模型技术,最新推出的智能运维服务平台,旨在以更智能的方式为运维用户解决运维难题,提升运维工作效率