這天打開電腦,發現master節點的狀態異常,是notReady狀態。其他計算機點還好時Ready狀態。
檢查etcd集群狀態
首先通過命令etcdctl member list確認etcd集群是OK的。
檢查master節點各個進程狀態
這時檢查master節點上的各個kube相關進程都在. 但通過systemctl status kubelet,kubelet的的進程顯示如下:

於是重啟kube-proxy和kubelet,查看進程狀態正常。但奇怪的是過了一會kubelet狀態又異常了。這時我使用命令 kubectl delete node k8s-master
刪除了這個master-node.但是這個node一直注冊不到集群中。
這時查看kubelet的log文件顯示如下:
因此可以判定是認證文件出了問題。
檢查證書
首先通過命令 kubectl get cs
查看獲取集群狀態,顯示如下:
使用命令kubectl get csr
查看證書狀態,顯示如下:
使用命令kubectl certificate approve node-csr-qwDqWMuffouPtl2DIqz8NN3cB9R-DvBg_ULg6mYrEKU
approve CSR 請求,最后重啟kubelet就可以了。但因為之前把這個節點刪除了,所以需要給這個節點打上所需要的label.