主要观点:Google Cloud 发布新开源工具 Kubernetes History Inspector (KHI),用于简化 Kubernetes 环境中的故障排除。
关键信息:
- KHI 能帮助管理员调试 Kubernetes 集群内的问题并找出根本原因,因在 Kubernetes 部署中整理问题视图复杂,而它可分析 Cloud Logging 收集的日志,提取各组件状态信息并以可视化时间线呈现,还能链接到原始日志数据。
- KHI 界面能提供集群历史的宏观和微观视图,展示单个组件状态变化及右侧所选组件的原始日志等,旨在说明过去各点组件间的关系。
- 在 Google 的 Kubernetes 播客中,Ishii 讨论了 KHI 的构建及特点,还考虑与 AI 大语言模型集成,William Denniss 对其 UI 印象深刻。
- 目前 KHI 仅与 GKE 和 Google Cloud 上的 Kubernetes 结合 Cloud Logging 工作,未来计划扩展到原生开源 Kubernetes 设置,其他云平台也有类似工具,如 Salesforce 的 Sloop 和 AWS 的相关选项。
重要细节: - KHI 有 Angular JS 前端和使用 WebGL 渲染可视化,GitHub 页面提供其规格、视觉元素和部署说明,是无需前期设置的容器镜像,可通过单命令启动。
- 如在 Kubernetes 部署中很多问题不是单个明显错误消息揭示,而是一系列事件,需要理解多个组件间日志条目的因果关系。
- 对于 EKS,AWS 提供将日志事件导出到 OpenSearch 并通过 OpenSearch 仪表盘提供可视化的选项,AKS Periscope 旨在检测 AKS 上的 Kubernetes 集群问题,但目前似乎没有 KHI 的可视化故障排除能力。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。