简单4步,利用Prometheus Operator实现自定义指标监控

2021-01-04
阅读 9 分钟
3.8k
在过去的文章中,我们花了相当大的篇幅来聊关于监控的话题。这是因为当你正在管理Kubernetes集群时,一切都会以极快的速度发生变化。因此有一个工具来监控集群的健康状态和资源指标极为重要。

详细教程丨使用Prometheus和Thanos进行高可用K8S监控

2020-09-10
阅读 33 分钟
5.8k
在过去的几年里,Kubernetes的采用量增长了数倍。很明显,Kubernetes是容器编排的不二选择。与此同时,Prometheus也被认为是监控容器化和非容器化工作负载的绝佳选择。监控是任何基础设施的一个重要关注点,我们应该确保我们的监控设置具有高可用性和高可扩展性,以满足不断增长的基础设施的需求,特别是在采用Kubernete...

Kubernetes Operator基础入门

2020-09-01
阅读 4 分钟
1.7k
你是否曾经想过SRE团队是如何有效地成功管理复杂的应用?在Kubernetes生态系统中,Kubernetes Operator可以给你答案。在本文中,我们将研究Operator是什么以及它们如何工作。

使用Thanos实现Prometheus指标联邦

2020-07-20
阅读 4 分钟
1.9k
Prometheus是CNCF中已经毕业的项目之一,主要用于监控和告警。在Kubernetes生态中,它是应用最为广泛的监控和告警工具之一。Rancher用户可以通过使用内置的监控堆栈来快速利用Prometheus。

搭建Prometheus平台,你必须考虑的6个因素

2020-06-02
阅读 3 分钟
1.6k
当前,Prometheus被许多企业和组织广泛使用,以监控其容器和微服务。但是在这一过程中,大型公司通常会陷入困境:当应用程序数量越来越多的时候,扩展监控指标则是一个十分重大的挑战。

小白也能轻松上手的Prometheus教程

2020-04-30
阅读 7 分钟
2.2k
这篇文章将承接此前关于使用Prometheus配置自定义告警规则的文章。在本文中,我们将demo安装Prometheus的过程以及配置Alertmanager,使其能够在触发告警时能发送邮件,但我们将以更简单的方式进行这一切——通过Rancher安装。

实用干货丨如何使用Prometheus配置自定义告警规则

2020-03-24
阅读 27 分钟
3.7k
Prometheus是一个用于监控和告警的开源系统。一开始由Soundcloud开发,后来在2016年,它迁移到CNCF并且称为Kubernetes之后最流行的项目之一。从整个Linux服务器到stand-alone web服务器、数据库服务或一个单独的进程,它都能监控。在Prometheus术语中,它所监控的事物称为目标(Target)。每个目标单元被称为指标(metri...

实操案例:使用Prometheus Operator进行集群监控

2019-09-19
阅读 6 分钟
3.6k
据Sysdig发布的容器报告,容器以及如Kubernetes等编排工具的使用增长了51%以上,大家开始将工作负载在集群中进行托管并管理。鉴于集群中短暂的状态,对于端到端的集群有一个十分重要的需求,即能够详细监控节点、容器以及pod。

Active Network实践:构建Kubernetes平台的最佳工具

2019-09-09
阅读 4 分钟
4.9k
本文是Active Network公司IT副总裁Nate的分享,他将在文中介绍他们构建Kubernetes平台中用到的各类工具,为你构建稳定、可靠、便捷的K8S平台分享经验和建议。

如何在多Kubernetes集群和多租户环境中使用Prometheus监控

2018-12-19
阅读 3 分钟
2.2k
过去十年里,我一直在虚拟化和云计算领域工作,在VMware、Mercury Interactive和Oracle领导产品管理工作,并格外关注DevOps方向。直到2014年,我开始认真关注并研究容器。当2015年Kubernetes面向大众推出时,我强烈地感受到,企业需要一种更简单的方法来在其内部环境中部署容器。那时,我创立了Qubeship.io,提供企业级...

Rancher Labs引入全球首个多集群、多租户的Prometheus支持!

2018-12-18
阅读 2 分钟
3k
近日,Rancher Labs宣布加强对Prometheus的支持,提高Kubernetes集群的可见度。Rancher也因此成为唯一一个在多集群、多租户环境中支持Prometheus的解决方案。