一次master節點notReady的修復過程


這天打開電腦,發現master節點的狀態異常,是notReady狀態。其他計算機點還好時Ready狀態。

檢查etcd集群狀態

首先通過命令etcdctl member list確認etcd集群是OK的。

檢查master節點各個進程狀態

這時檢查master節點上的各個kube相關進程都在. 但通過systemctl status kubelet,kubelet的的進程顯示如下:


於是重啟kube-proxy和kubelet,查看進程狀態正常。但奇怪的是過了一會kubelet狀態又異常了。這時我使用命令 kubectl delete node k8s-master刪除了這個master-node.但是這個node一直注冊不到集群中。
這時查看kubelet的log文件顯示如下:

因此可以判定是認證文件出了問題。

檢查證書

首先通過命令 kubectl get cs查看獲取集群狀態,顯示如下:

使用命令kubectl get csr查看證書狀態,顯示如下:

使用命令kubectl certificate approve node-csr-qwDqWMuffouPtl2DIqz8NN3cB9R-DvBg_ULg6mYrEKUapprove CSR 請求,最后重啟kubelet就可以了。但因為之前把這個節點刪除了,所以需要給這個節點打上所需要的label.


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM