問題描述:測試環境由於異常斷電導致服務器重啟一后,有一個節點的狀態一直是NotReady
.通過journalctl -f -u kubelet
沒有錯誤日志輸出.通過tail /var/log/messages
查看日志信息,發現有輸出日志avahi-daemon[24276]: Host name conflict, retrying with k8s-node5-08
這樣的錯誤.經過排查這是由 於avahi
的一個bug造成的.截至目前該問題已經修復,但是新的版本還沒有發布.
目前的解決辦法是先把這個節點從集群中刪除(kubectl delete node k8s-node5),由於apiserver現在已經無法同這個節點進行通信,因此pod驅離也無法進行,只能夠先刪除節點了.刪除完成以后,重命名該節點的名稱(hostnamectl set-hostname xxx
),然后執行kubeadm reset
重置該節點,然后再重新加入集群,問題算是得到解決.