kubernetes 1.20 要去掉對 Docker的支持,具體看這里,本篇文章介紹用 containerd 替換 docker,從work節點開始,然后才到master節點。
首先查看集群
[root@node1 ~]# kubectl get node
NAME STATUS ROLES AGE VERSION
k8s-master Ready control-plane,master 101d v1.20.1
k8s-worker-01 Ready <none> 101d v1.20.1
k8s-worker-02 Ready <none> 2d22h v1.20.1
ssh連接到 k8s-worker-01
A. 在work節點上替換
- 從服務中刪除一個節點
使用 kubectl drain
從節點安全地逐出所有 Pods。 安全的驅逐過程允許 Pod 的容器 體面地終止, 並確保滿足指定的 PodDisruptionBudgets。
kubectl drain k8s-worker-01 --ignore-daemonsets --delete-emptydir-data
- 停止 kubelet
sudo systemctl stop kubelet
- 卸載docker
sudo apt remove docker-ce docker-ce-cli
sudo apt autoremove
- 啟用containerd的前置條件
為了containerd能和kubernetes正常運行,需加載overlay和br_netfilter兩個模塊。
下面創建containerd.conf,在啟動時加載這些模塊
cat <<EOF | sudo tee /etc/modules-load.d/containerd.conf
overlay
br_netfilter
EOF
下一條命令將加載所需的模塊
sudo modprobe overlay
sudo modprobe br_netfilter
創建一個文件,用於系統啟動時設置其他參數
cat <<EOF | sudo tee /etc/sysctl.d/99-kubernetes-cri.conf
net.bridge.bridge-nf-call-iptables = 1
net.ipv4.ip_forward = 1
net.bridge.bridge-nf-call-ip6tables = 1
EOF
應用一下設置
sudo sysctl --system
安裝以下軟件包以允許apt通過HTTPS使用倉庫。
sudo apt-get update && sudo apt-get install -y apt-transport-https ca-certificates curl software-properties-common
添加Docker官方GPG key,為啥要這樣呢?因為containerd 也需要使用Docker鏡像倉庫去搜索鏡像。
curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo apt-key --keyring /etc/apt/trusted.gpg.d/docker.gpg add -
添加docker源
sudo add-apt-repository "deb [arch=amd64] https://download.docker.com/linux/ubuntu focal stable"
- 安裝containerd
sudo apt-get update && sudo apt-get install -y containerd.io
- 配置containerd
sudo mkdir -p /etc/containerd
sudo containerd config default | sudo tee /etc/containerd/config.toml
- 使用systemd cgroup driver
sudo vim /etc/containerd/config.toml
找到下面這行,添加SystemdCgroup = true
,例子如下:
[plugins."io.containerd.grpc.v1.cri".containerd.runtimes.runc]
...
[plugins."io.containerd.grpc.v1.cri".containerd.runtimes.runc.options]
SystemdCgroup = true
- 啟動服務
sudo systemctl enable containerd
sudo systemctl start containerd
sudo systemctl status containerd
- 配置Kubelet以使用containerd
修改 /var/lib/kubelet/kubeadm-flags.env
文件,改為如下
KUBELET_KUBEADM_ARGS="--container-runtime=remote --container-runtime-endpoint=/run/containerd/containerd.sock"
- 啟動kubernetes
sudo systemctl daemon-reload
sudo systemctl start kubelet
驗證
[root@node1 ~]# kubectl get node
NAME STATUS ROLES AGE VERSION
k8s-master Ready control-plane,master 101d v1.20.1
k8s-worker-01 Ready,SchedulingDisabled <none> 101d v1.20.1
k8s-worker-02 Ready <none> 3d v1.20.1
如果一切正常,你剛剛操作的機器就會顯示Ready,SchedulingDisabled
,如果顯示Not ready
,你就要檢查是否嚴格按照我的步驟來操作的。
- 啟用調度
kubectl Uncordon k8s-worker-01
重新查看集群狀態,會發現k8s-worker-01
的 STATUS 已經變成了 Ready,你可以對其他節點進行操作了。
B. 在master節點上替換
- 停止master節點
由於master節點不能drain ,所以只能停止kubelet,work節點和pods會繼續運行,但無法進行管理。
sudo systemctl stop kubelet
執行前面的 3-10 步驟
- 修改kubernetes配置文件
最后一步是從kubernetes修改配置文件。盡管此階段的主節點和工作節點已經在使用containerd,但是還需要調整配置設置,否則在運行kubeadm命令時會出錯(例如,將kubernetes升級到新版本)
在master節點執行
kubectl edit node k8s-master
將
kubeadm.alpha.kubernetes.io/cri-socket: /var/run/dockershim.sock
修改為
kubeadm.alpha.kubernetes.io/cri-socket: /run/containerd/containerd.sock
您可以運行以下命令檢查kubeadm是否正常運行。通過運行以下命令,該命令將檢查集群是否可以升級。
sudo kubeadm upgrade plan