簡介

Scheduler 是 kubernetes 的調度器，主要的任務是把定義的 pod 分配到集群的節點上。聽起來非常簡單，但有很多要考慮的問題：

公平：如何保證每個節點都能被分配資源
資源高效利用：集群所有資源最大化被使用
效率：調度的性能要好，能夠盡快地對大批量的 pod 完成調度工作
靈活：允許用戶根據自己的需求控制調度的邏輯

Sheduler 是作為單獨的程序運行的，啟動之后會一直堅挺 API Server，獲取 PodSpec.NodeName 為空的 pod，對每個 pod 都會創建一個 binding，表明該 pod 應該放到哪個節點上

調度過程

調度分為幾個部分：首先是過濾掉不滿足條件的節點，這個過程稱為 predicate ；然后對通過的節點按照優先級排序，這個是 priority ；最后從中選擇優先級最高的節點。如果中間任何一步驟有錯誤，就直接返回錯誤

Predicate 有一系列的算法可以使用：

PodFitsResources ：節點上剩余的資源是否大於 pod 請求的資源
PodFitsHost ：如果 pod 指定了 NodeName，檢查節點名稱是否和 NodeName 匹配
PodFitsHostPorts ：節點上已經使用的 port 是否和 pod 申請的 port 沖突
PodSelectorMatches ：過濾掉和 pod 指定的 label 不匹配的節點
NoDiskConflict ：已經 mount 的 volume 和 pod 指定的 volume 不沖突，除非它們都是只讀

如果在 predicate 過程中沒有合適的節點，pod 會一直在 pending 狀態，不斷重試調度，直到有節點滿足條件。經過這個步驟，如果有多個節點滿足條件，就繼續 priorities 過程：按照優先級大小對節點排序
優先級由一系列鍵值對組成，鍵是該優先級項的名稱，值是它的權重（該項的重要性）。這些優先級選項包括：

LeastRequestedPriority ：通過計算 CPU 和 Memory 的使用率來決定權重，使用率越低權重越高。換句話說，這個優先級指標傾向於資源使用比例更低的節點
BalancedResourceAllocation ：節點上 CPU 和 Memory 使用率越接近，權重越高。這個應該和上面的一起使用，不應該單獨使用
ImageLocalityPriority ：傾向於已經有要使用鏡像的節點，鏡像總大小值越大，權重越高

通過算法對所有的優先級項目和權重進行計算，得出最終的結果

自定義調度器

除了 kubernetes 自帶的調度器，你也可以編寫自己的調度器。通過 spec:schedulername 參數指定調度器的名字，可以為 pod 選擇某個調度器進行調度。比如下面的 pod 選擇 my-scheduler 進行調度，而不是默認的 default-scheduler ：

apiVersion: v1
kind: Pod
metadata:
  name: annotation-second-scheduler
  labels:
    name: multischeduler-example
spec:
  schedulername: my-scheduler
  containers:
  - name: pod-with-second-annotation-container
    image: wangyanglinux/myapp:v1

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 k8s調度器介紹（調度框架版本） Kubernetes K8S之調度器kube-scheduler詳解 Kubernetes（k8s）資源控制器 RS、Deployment詳細介紹 Kubernetes（k8s）的存儲configmap詳細介紹 Kubernetes（k8s）的Service Ingress詳細介紹 Kubernetes（k8s）的存儲Volume 詳細介紹 Kubernetes（k8s）的存儲Secret 詳細介紹 Kubernetes（k8s）的Service - 代理模式詳細介紹 Kubernetes（k8s）的存儲PV-PVC詳細介紹 [kubernetes集群調度] - ① k8s - schedule 簡介 & 調度過程 & 自定義調度器