在 Kubernetes 中应该如何设置 CPU 的 requests 和 limits


文本翻译自: https://itnext.io/cpu-limits-and-requests-in-kubernetes-fa9d5...


在 Kubernetes 中,我应该如何设置 CPU 的 requests 和 limits?

热门答案包括:

  • 始终使用 limits !
  • 永远不要使用 limits,只使用 requests !
  • 都不用;可以吗?

让我们深入研究它。

在 Kubernetes 中,您有两种方法来指定一个 pod 可以使用多少 CPU:

  1. Requests 通常用于确定平均消耗。
  2. Limits 设置允许的最大资源数。

Kubernetes 调度器使用 requests 来确定 pod 应该分配到集群中的哪个节点。

由于调度器并不知道实际消耗(pod 尚未启动),它需要一个提示。

但它并没有就此结束。

Kubernetes 调度器使用 requests 来决定如何将 pod 分配给节点

CPU requests 还用于将同一个节点上的 CPU 资源如何分配给不同的容器。

让我们看一个例子:

  • 一个节点只有一个 CPU。
  • 容器 A requests 0.1 个 vCPU。
  • 容器 B requests 0.2 个 vCPU。

当两个容器都尝试使用 100% 的可用 CPU 时会发生什么?

两个容器的 CPU 使用率

由于 CPU 请求不限制消耗,因此两个容器都将使用所有可用的 CPU。

但是,由于容器 B 的请求与另一个相比增加了一倍,因此最终的 CPU 分配是:容器 1 使用 0.3vCPU,另一个使用 0.6vCPU(双倍数量)。

两个容器都使用所有可用的 CPU,但它们保持比例配额

Requests 适用于:

  • 设置基准(给我至少 X 数量的 CPU)。
  • 设置 pod 之间的关系(这个 pod A 使用的 CPU 是另一个的两倍)。

但不影响硬性限制。

为此,您需要 CPU limits。

设置 CPU limits 时,您定义了 period 周期和 quota 配额。

例如:

  • 周期:100000 微秒 (0.1s)。
  • 配额:10000 微秒 (0.01s)。

我只能每 0.1 秒使用 CPU 0.01 秒。

这也缩写为“100m”。

CPU 限制中的配额和周期

如果你的容器有硬限制并且想要更多的 CPU,它必须等待下一个周期。

您的进程受到限制。

一个被 CPU 限制的进程

那么您应该在 Pod 中如何设置 CPU requests 和 limits?

一种简单(但不准确)的方法是将最小的 CPU 单元计算为:

REQUEST = NODE_CORES * 1000 / MAX_NUM_PODS_PER_NODE

对于 1 个 vCPU 节点和 10 个 Pod ,最小单元就是 1 * 1000 / 10 = 100Mi

将最小单位或其乘数分配给您的容器。

将 CPU 请求分配给 Pod 和容器

例如,如果您不知道 Pod A 需要多少 CPU,但您确定它是 Pod B 的两倍,您可以设置:

  • Request A:1 个单元
  • Request B:2 个单位

如果容器使用 100% CPU,它们将根据它们的权重 (1:2) 重新分配 CPU。

两个 Pod 竞争 CPU 资源

更好的方法是监控应用程序并得出平均 CPU 利用率。

您可以使用现有的监控基础设施来完成此操作,或者使用 Vertical Pod Autoscaler 来监视并报告平均请求值。

你应该如何设置 limits?

  1. 您的应用可能已经有“硬性”限制。(例如单线程的应用即使分配了 2 个核,也最多只使用 1 个核)。
  2. 你可以设置:limit = 99th 分位数 + 30–50%。

您应该分析应用程序(或使用 VPA)以获得更详细的答案。

CPU 的第 99 百分位数

您应该始终设置 CPU requests 吗?

绝对没错。

这是 Kubernetes 中的标准良好实践,可帮助调度器更有效地分配 pod。

您应该始终设置 CPU limits 吗?

这有点争议,但总的来说,我是这么认为的。

你可以进行更深入的了解:https://dnastacio.medium.com/why-you-should-keep-using-cpu-limits-on-kubernetes-60c4e50dfc61

其它的一些相关链接:


凌虚的专栏
Node.js & Python & Golang ,编程,应用开发,消息队列,中间件,数据库,容器化,大数据,图像处理,...
3.8k 声望
1.3k 粉丝
0 条评论
推荐阅读
Java 应用程序在 Kubernetes 上棘手的内存管理
在容器环境中运行 Java 应用程序需要了解两者 —— JVM 内存机制和 Kubernetes 内存管理。这两个环境一起工作会产生一个稳定的应用程序,但是,错误配置最多可能导致基础设施超支,最坏情况下可能会导致应用程序不...

rife阅读 576

终于卷完了!Redis 打怪升级进阶成神之路(2023 最新版)!
是一种非关系型数据库服务,它能解决常规数据库的并发能力,比如传统的数据库的IO与性能的瓶颈,同样它是关系型数据库的一个补充,有着比较好的高效率与高性能。专注于key-value查询的redis、memcached、ttserver。

民工哥11阅读 989

封面图
golang学习之旅——解开心中的go mod疑惑
在go1.16版本发布后,go module由原来的默认值 auto 变为 on 了,这意味着后续开发中,go更推荐用go module 模式开发,而不是gopath模式开发了。

Keson11阅读 14.8k

算法可视化:一文弄懂 10 大排序算法
在本文中,我们将通过动图可视化加文字的形式,循序渐进全面介绍不同类型的算法及其用途(包括原理、优缺点及使用场景)并提供 Python 和 JavaScript 两种语言的示例代码。除此之外,每个算法都会附有一些技术说...

破晓L7阅读 945

封面图
硬卷完了!MongoDB 打怪升级进阶成神之路( 2023 最新版 )!
前面我们学习:MySQL 打怪升级进阶成神之路、Redis 打怪升级进阶成神之路,然后我们还在继续 NoSQL 的卷王之路。从第一篇文章开始,我们逐步详细介绍了 MogoDB 基础概念、安装和最基本的CURD操作、索引和聚合、工...

民工哥6阅读 553

封面图
「刷起来」Go必看的进阶面试题详解
逃逸分析是Go语言中的一项重要优化技术,可以帮助程序减少内存分配和垃圾回收的开销,从而提高程序的性能。下面是一道涉及逃逸分析的面试题及其详解。

王中阳Go4阅读 1.9k评论 1

封面图
架构设计-高性能篇
大家好,我是易安!今天我们谈一谈架构设计中的高性能架构涉及到的底层思想。本文分为缓存架构,单服务器高性能模型,集群下的高性能模型三个部分,内容很干,希望你仔细阅读。

架构狂人4阅读 795

3.8k 声望
1.3k 粉丝
宣传栏