头图

  Kubernetes Job是一次性任务的控制器。它控制Pod中的容器执行完成任务后不会再重启,并将容器的状态设置为“Completed”。如果Pod中的容器出现了异常终止的情况,Job控制器会根据设置的重启策略进行Pod的重启。如果因为Node节点的故障导致Pod无法正常运行,Job控制器会通过调度器将Pod调度到其他的节点上运行。Job控制器的运行方式分为:单工作队列的串行方式和多工作队列的并行方式。

  视频讲解如下:
https://www.bilibili.com/video/BV1sb421E7wF/?aid=1806189535&c...

  下面通过一个具体示例来演示如何使用Job控制器的多工作队列的并行方式。在创建多工作队列的Job并行方式时,需要指定两个重要的参数。它们分别是:

  • .spec.parallelism:作业并行并行执行的数量,即:队列的数量
  • .spec.completions:作业需要完成数量,即:作业总数量

  下面的例子中,需要完成的作业总数量是5个,并且创建了3个队列,即:作业的并行度是3。整个作业执行完成需要2分钟。
(1)创建“job-demo2.yaml”文件,并输入下面的内容:

apiVersion: batch/v1
kind: Job
metadata:
    name: job-demo2
spec:
    completions: 5
    parallelism: 3
    template:
      spec:
        containers:
        - name: job-demo2
          image: nginx
          imagePullPolicy: IfNotPresent
          # 模拟作业需要执行60秒钟 
          command: ["/bin/bash","-c","sleep 60"]
        #重启策略,不进行重启
        restartPolicy:  Never 

(2)执行命令创建Job。

kubectl apply -f job-demo2.yaml

(3)查看Job信息和Pod信息,如下图所示。

kubectl get job,pod

# 提示:由于作业总数量是5个,但只要3个队列并行执行。
# 因此这里就只看到了Job控制器启动了3个Pod。

image.png

(4)等待60秒后,再次查看Job信息和Pod信息,如下图所示。

kubectl get job,pod

# 提示:经过60秒种后,第一批执行的3个作用已经完成。
# Job控制器又使用了2个队列来执行剩下的两个作业。

image.png

(5)再等待60秒后,再次查看Job信息和Pod信息,如下图所示。

kubectl get job,pod

# 提示:经过120秒钟后,5个作业都成功执行完成。

image.png


赵渝强老师
33 声望11 粉丝

20年以上的IT行业从业经历,清华大学计算机软件工程专业毕业,京东大学大数据学院院长,Oracle中国有限公司高级技术顾问;曾在BEA、甲骨文、摩托罗拉等世界500强公司担任高级软件架构师或咨询顾问等要职,精通大...