Velero系列文章(三):Velero资源过滤

2022-12-11
阅读 2 分钟
566
根据资源过滤格式为: resource.group, 如 storageclasses.storage.k8s.io比如要排除以下资源:replicasetsendpointslices.discovery.k8s.ioendpointsevents.events.k8s.iopodsauthconfigs.management.cattle.ioclusterrepos.catalog.cattle.ioclusters.management.cattle.iocsinodes.storage.k8s.iofeatures.management.c...

Prometheus 性能调优-水平分片

2022-11-26
阅读 1 分钟
2k
简介之前笔者有连续 2 篇文章:Prometheus 性能调优 - 什么是高基数问题以及如何解决?如何精简 Prometheus 的指标和存储占用陆续介绍了一些 Prometheus 的性能调优技巧,包括高基数问题的解决以及精简 Prometheus 的指标和存储占用。今天再介绍一个新的调优思路:水平分片。水平分片如果你正在面临的不是因为 label 导...
封面图

通过 API 快速创建 AlertManager silence

2022-11-19
阅读 3 分钟
1.1k
概述通常我们要 silence 某个 AlertManager 的 alert 时,需要通过 UI 界面操作,如下图:效率有点低,而且不够自动化,那么是否可以有一种办法快速创建 AlertManager silence 呢?-- 有的,通过 API.API Payloadv1如下: {代码...} v2 {代码...} 具体实现curl 实现📝 Notes:以 v1 api 为例如下: {代码...} 📝Notes:在 K8...

如何精简 Prometheus 的指标和存储占用

2022-11-18
阅读 13 分钟
1k
在这种情况下,要优化 Prometheus 性能, 优化存储占用. 第一时间想到的可能是各种 Prometheus 的兼容存储方案, 如 Thanos 或 VM、Mimir 等。但是实际上虽然集中存储、长期存储、存储降采样及存储压缩可以一定程度解决相关问题,但是治标不治本。

Containerd 如何配置 Proxy?

2022-11-17
阅读 2 分钟
1.4k
前言在某些 air gap 场景中,往往需要离线或使用代理 (Proxy), 例如:需要通过 Proxy pull 容器镜像:Docker Hub: docker.ioQuay: quay.ioGCR: gcr.ioGitHub 镜像库:ghcr.io在某些企业环境中,需要通过代理访问外部服务Docker 如何配置代理想必大家都很清楚,但是自从 Kubernetes 1.20 版本以后开始弃用 Docker, contai...

K8s如何启用cgroup2支持?

2022-11-16
阅读 3 分钟
1.2k
📚️Reference:control groups(控制组),通常被称为cgroup,是Linux内核的一项功能。它允许将进程组织成分层的组,然后限制和监控各种资源的使用。 内核的cgroup接口是通过一个叫做cgroupfs的伪文件系统提供的。 分组是在核心的cgroup内核代码中实现的,而资源跟踪和限制是在一组每个资源类型的子系统中实现的(内存、CPU...

在 K8s 集群中创建 DERP 服务器

2022-11-13
阅读 4 分钟
978
Tailscale 允许您轻松管理对私有资源的访问(本质上是个 VPN 工具),快速 SSH 进入网络上的设备,并且可以在世界上的任何地方安全地工作。

七步成诗 - 快速创建有效 SLO

2022-11-13
阅读 3 分钟
848
之前的文章- 如何配置 SLO - 东风微鸣技术博客 (ewhisper.cn) 介绍了一些常用的各类 SLO, 但是在实际制定 SLO 过程中,并不一定适合实际业务需求。本次介绍 SLO 的最佳实践 - 如何 7 步创建有效的 SLO.

使用 Prometheus 配置 SLO 监控和告警

2022-11-12
阅读 8 分钟
951
概述Prometheus 作为云原生和容器平台监控的事实标准,本期我们来看一下如何通过 Prometheus 配置 SLO 监控和告警.SLA SLO SLI 系列文章SLO 告警SLO 的告警, 根据 Google SRE 官方实践, 建议使用如下几个维度的告警:Burn Rate(消耗率)AlertsError Budget (错误预算)AlertsError Budget假设我们与用户的合同规定,在 7天...
封面图

K8s 生产最佳实践-限制 NameSpace 资源用量

2022-11-12
阅读 5 分钟
740
想象一下这个场景:多个系统运行在同一套 K8s 集群上,有重要系统,也有不太重要的系统。但是某一天,某个不重要的系统突然占用了该 K8s 集群的所有资源,导致该集群上的其他系统的正常运行受到影响。本文介绍了 Kubernetes 平台如何管理容量,以及作者对管理员的注意事项和建议。
封面图