介紹
job,主要用於負責批量處理(一次要處理指定數量任務)短暫的一次性(每個任務僅運行一次就結束)任務,job 特點如下
- 當 job 創建的 pod 執行成功結束時,job 將記錄成功結束的 pod 數量
- 當成功結束的 pod 達到指定的數量時,job 將完成執行
Job的資源清單文件:
apiVersion: batch/v1 # 版本號 kind: Job # 類型 metadata: # 元數據 name: # job 名稱 namespace: # 所屬命名空間 labels: #標簽 controller: job spec: # 詳情描述 completions: 1 # 指定 job 需要成功運行 Pods 的次數。默認值: 1 parallelism: 1 # 指定 job 在任一時刻應該並發運行 Pods 的數量。默認值: 1,如果上面的 completions 為 6 ,這個參數為 3 ,表示有 6 個 pod,允許有 3 個 pod 並發運行 activeDeadlineSeconds: 30 # 指定 job 可運行的時間期限,超過時間還未結束,系統將會嘗試進行終止。 backoffLimit: 6 # 指定 job 失敗后進行重試的次數。默認是 6 manualSelector: true # 是否可以使用 selector 選擇器選擇 pod,默認是 false selector: # 選擇器,通過它指定該控制器管理哪些 pod matchLabels: # Labels 匹配規則 app: counter-pod matchExpressions: # Expressions 匹配規則 - {key: app, operator: In, values: [counter-pod]} template: # 模板,當副本數量不足時,會根據下面的模板創建 pod 副本 metadata: labels: app: counter-pod spec: restartPolicy: Never # 重啟策略只能設置為 Never 或者 OnFailure containers: - name: counter image: busybox:1.30 command: ["bin/sh","-c","for i in 9 8 7 6 5 4 3 2 1; do echo $i;sleep 2;done"]
關於重啟策略設置的說明
- 如果指定為 OnFailure,則 job 會在 pod 出現故障時重啟容器,而不是創建 pod,failed 次數不變
- 如果指定為 Never,則 job 會在 pod 出現故障時創建新的 pod,並且故障 pod 不會消失,也不會重啟,failed 次數加 1
- 如果指定為 Always 的話,就意味着一直重啟,意味着 job 任務會重復去執行了,當然不對,所以不能設置為 Always
job 的使用
創建 pc-job.yaml,內容如下:
apiVersion: batch/v1 kind: Job # 類型為 job metadata: name: pc-job namespace: zouzou spec: manualSelector: true # 是否可以使用 selector 選擇器選擇 pod,默認是false selector: matchLabels: app: counter-pod template: metadata: labels: app: counter-pod spec: restartPolicy: Never # 設置重啟策略 containers: - name: counter image: busybox:1.30 command: ["bin/sh","-c","for i in 9 8 7 6 5 4 3 2 1; do echo $i;sleep 3;done"]
上面 job 要完成的任務是,循環輸入 9、8、7、6、5、4、3、2、1,每輸入一個就等待 3 s
為了更好的查看效果,我們這里在開兩個窗口,分別監聽 job 和 pod
創建 job
# 創建 job kubectl create -f pc-job.yaml
查看上面動態監聽的數據
從上面的結果可以看到,只有一個 job 在運行,而且最后 pod 完成之后, READY 的可提供服務的變為了 0
通過觀察 pod 狀態可以看到,pod 在運行完畢任務后,就會變成 Completed 狀態
任務執行完成之后在來看下 job 和 pod
# job,COMPLETIONS / 前面的表示完成的數量,/ 后面的表示總的數量 [root@dce-10-6-215-215 ~]# kubectl get job -n zouzou -o wide NAME COMPLETIONS DURATION AGE CONTAINERS IMAGES SELECTOR pc-job 1/1 33s 5m53s counter busybox:1.30 app=counter-pod # pod [root@dce-10-6-215-215 ~]# kubectl get job -n zouzou -o wide NAME COMPLETIONS DURATION AGE CONTAINERS IMAGES SELECTOR pc-job 1/1 33s 5m53s counter busybox:1.30 app=counter-pod
並發執行 job
接下來,調整下 pod 運行的總數量和並行數量 即:在 spec 下設置下面兩個選項 :
- completions: 6 指定 job 需要成功運行 Pods 的次數為 6
- parallelism: 3 指定 job 並發運行 Pods 的數量為 3
然后重新運行 job,觀察效果,此時會發現,job 會每次運行 3 個 pod,總共執行了 6 個 pod
先刪除之前的 job
kubectl delete -f pc-job.yaml
修改 pc-job.yaml 文件,內容如下
apiVersion: batch/v1 kind: Job # 類型為 job metadata: name: pc-job namespace: zouzou spec: completions: 6 # 指定 job 需要成功運行 Pods 的次數。默認值: 1 parallelism: 3 # 指定並發數 manualSelector: true # 是否可以使用 selector 選擇器選擇 pod,默認是false selector: matchLabels: app: counter-pod template: metadata: labels: app: counter-pod spec: restartPolicy: Never # 設置重啟策略 containers: - name: counter image: busybox:1.30 command: ["bin/sh","-c","for i in 9 8 7 6 5 4 3 2 1; do echo $i;sleep 3;done"]
為了更好的查看效果,我們這里在開兩個窗口,分別監聽 job 和 pod
kubectl create -f pc-job.yaml
查看 job
查看 pod
[root@dce-10-6-215-215 ~]# kubectl get pod -n zouzou -w NAME READY STATUS RESTARTS AGE nginx3-c5d7c9466-vnt9c 1/1 Running 0 22h pc-job-4xhlp 0/1 Pending 0 0s pc-job-ls4wr 0/1 Pending 0 0s pc-job-l48z9 0/1 Pending 0 0s pc-job-4xhlp 0/1 Pending 0 0s pc-job-ls4wr 0/1 Pending 0 0s pc-job-l48z9 0/1 Pending 0 0s pc-job-4xhlp 0/1 ContainerCreating 0 0s pc-job-ls4wr 0/1 ContainerCreating 0 0s pc-job-l48z9 0/1 ContainerCreating 0 0s pc-job-l48z9 0/1 ContainerCreating 0 2s pc-job-ls4wr 0/1 ContainerCreating 0 2s pc-job-4xhlp 0/1 ContainerCreating 0 3s pc-job-l48z9 0/1 ContainerCreating 0 3s pc-job-ls4wr 0/1 ContainerCreating 0 3s pc-job-4xhlp 0/1 ContainerCreating 0 3s pc-job-ls4wr 1/1 Running 0 4s pc-job-4xhlp 1/1 Running 0 4s pc-job-l48z9 1/1 Running 0 4s pc-job-l48z9 0/1 Completed 0 32s pc-job-vhg2h 0/1 Pending 0 0s pc-job-4xhlp 0/1 Completed 0 32s pc-job-t8nkh 0/1 Pending 0 0s pc-job-ls4wr 0/1 Completed 0 32s pc-job-vhg2h 0/1 Pending 0 0s pc-job-t8nkh 0/1 Pending 0 0s pc-job-rr4md 0/1 Pending 0 0s pc-job-rr4md 0/1 Pending 0 0s pc-job-vhg2h 0/1 ContainerCreating 0 0s pc-job-t8nkh 0/1 ContainerCreating 0 0s pc-job-rr4md 0/1 ContainerCreating 0 0s pc-job-vhg2h 0/1 ContainerCreating 0 3s pc-job-t8nkh 0/1 ContainerCreating 0 3s pc-job-vhg2h 0/1 ContainerCreating 0 3s pc-job-rr4md 0/1 ContainerCreating 0 3s pc-job-t8nkh 0/1 ContainerCreating 0 3s pc-job-rr4md 0/1 ContainerCreating 0 3s pc-job-vhg2h 1/1 Running 0 4s pc-job-rr4md 1/1 Running 0 5s pc-job-t8nkh 1/1 Running 0 5s pc-job-vhg2h 0/1 Completed 0 32s pc-job-rr4md 0/1 Completed 0 32s pc-job-t8nkh 0/1 Completed 0 32s
可以從上面結果看到,在 0-3s 的時候,有三個 pod 在創建,在 4s 的時候,有三個 pod 在 Running,說明是並發了 3 個 pod。
在 32s 的時候,之前創建的三個 pod 已經完成了,狀態為 Completed。這時候,又有三個 pod 在創建,因為是新創建的 pod,所以 AGE 為 0
等到 4s 的時候,三個 pod 已經創建完成了,開始運行。在 32s 的時候,三個 pod 運行完成了,狀態為 Completed
刪除 job
刪除 job 也有兩種方式,一種是通過 yaml 文件,如下
kubectl delete -f pc-job.yaml
還有一種是通過 job 名稱進行刪除
kubectl delete job pc-job -n zouzou