欢迎访问我的GitHub
这里分类和汇总了欣宸的全部原创(含配套源码):https://github.com/zq2599/blog_demos
本篇概览
本文是欣宸在学习Kubernetes调度器的过程中,对亲和性相关知识点的整理和总结,这是一篇笔记性质的博客
kubernetes默认调度器的调度过程:
- 调度过程如下:
- 预选(Predicates)
- 优选(Priorities)
- 选定(Select)
亲和性一览
这里将亲和性先分类,便于理解
节点亲和性和pod亲和性的区别
- 举个例子,假设给小明分配班级(小明是pod,班级是节点)
- 节点亲和性:直接告诉小明,你去一年级
- pod亲和性:从小朋友中找出和小明同年的,找到了小张,发现小张是一年级的,于是让小明去一年级
节点亲和性:硬亲和性
- requiredDuringSchedulinglgnoredDuringExecution:用于定义节点硬亲和性
- nodeSelectorTerm:节点选择器,可以有多个,之间的关系是<font color="red">逻辑或</font>,即一个nodeSelectorTerm满足即可
- matchExpressions:匹配规则定义,多个之间的关系是<font color="red">逻辑与</font>,即同一个nodeSelectorTerm下所有matchExpressions定义的规则都匹配,才算匹配成功
示例:
apiVersion: v1 kind: Pod metadata: name: with-required-nodeaffinity spec: affinity: nodeAffinity: requiredDuringSchedulingIgnoredDuringExecution: nodeSelectorTerms: - matchExpressions: - {key: zone, operator: In, values: ["foo"]} containers: - name: nginx image: nginx
- 功能与<font color="blue">nodeSelector</font>类似,用的是匹配表达式,可以被理解为<font color="red">新一代节点选择器</font>
- 不满足硬亲和性条件时,pod为Pending状态
- 在预选阶段,节点硬亲和性被用于预选策略<font color="blue">MatchNodeSelector</font>
节点亲和性:软亲和性
- 特点:条件不满足时也能被调度
示例:
apiVersion: apps/v1 kind: Deployment metadata: name: myapp-deploy-with-node-affinity spec: replicas: 3 selector: matchLabels: app: nginx template: metadata: name: nginx labels: app: nginx spec: affinity: nodeAffinity: preferredDuringSchedulingIgnoredDuringExecution: - weight: 60 preference: matchExpressions: - {key: zone, operator: In, values: ["foo"]} - weight: 30 preference: matchExpressions: - {key: ssd, operator: Exists, values: []} containers: - name: nginx image: nginx
- 集群中的节点,由于标签不同,导致的优先级结果如下:
- 在优选阶段,节点软亲和性被用于优选函数<font color="blue">NodeAffinityPriority</font>
- 注意:NodeAffinityPriority<font color="red">并非决定性因素</font>,因为优选阶段还会调用其他优选函数,例如<font color="blue">SelectorSpreadPriority</font>(将pod分散到不同节点以分散节点故障导致的风险)
- pod副本数增加时,分布的比率会参考节点亲和性的权重
Pod亲和性(podAffinity)
- 如果需求是:新增的pod要和已经存在pod(假设是A)在同一node上,此时用节点亲和性是无法完成的,因为A可能和节点没啥关系(可能是随机调度的),此时只能用pod亲和性来实现
- pod亲和性:一个pod与已经存在的某个pod的亲和关系,需要通过举例来说明
- 创建一个deployment,这个pod有标签<font color="blue">app=tomcat</font>:
kubectl run tomcat -l app=tomcat --image tomcat:alpine
- 创建pod,需求是<font color="blue">和前面的pod在一起</font>,使用pod亲和性来实现:
apiVersion: v1
kind: Pod
metadata:
name: with-pod-affinity-1
spec:
affinity:
podAffinity:
requiredDuringSchedulingIgnoredDuringExecution:
- labelSelector:
matchExpressions:
- {key: app, operator: In, values: ["tomcat"]}
topologyKey: kubernetes.io/hostname
containers:
- name: nginx
image: nginx
- 调度逻辑:
- 表面上看,最终只是根据hostname去调度的,但如果topologyKey的值是多个节点所拥有的,就更有通用性了,如下图,topologyKey等于filure-domain.beta.kubernetes.io/zone:
- 硬亲和:requiredDuringSchedulingIgnoredDuringExecution
软亲和:preferredDuringSchedulingIgnoredDuringExecution
Pod反亲和(podAntiAffinity)
- 与亲和性相反,将当前pod调度到满足匹配条件之外的节点上
- 适用场景:
- 分散同一类应用
- 将不同安全级别的pod调度至不同节点
- 示例如下,匹配表达式和自身标签一致,作用是分散同一类应用,让相同pod不要调度到同一个节点:
apiVersion: apps/v1
kind: Deployment
metadata:
name: myapp-with-pod-anti-affinity
spec:
replicas: 4
selector:
matchLabels:
app: myapp
template:
metadata:
name: myapp
labels:
app: myapp
spec:
affinity:
podAntiAffinity:
requiredDuringSchedulingIgnoredDuringExecution:
- labelSelector:
matchExpressions:
- {key: app, operator: In, values: ["myapp"]}
topologyKey: kubernetes.io/hostname
containers:
- name: nginx
image: nginx
如果集群中只有三个节点,那么执行上述yaml的结果就是最多创建三个pod,另一个始终处于pending状态
参考
- 本篇笔记参考了以下文章,两张图片也来自该文章,致敬作者<font color="blue">山山仙人博客</font>
- https://www.ssgeek.com/post/kubernetes-pod-diao-du-zhi-qin-he...
欢迎关注思否:程序员欣宸
学习路上,你不孤单,欣宸原创一路相伴...
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。