kubernetes斷電重啟 導致部分pod無法刪除
dashboard上處於黃色
kubectl get處於terminate 狀態
kubectl delete報錯:
An error occurred while waiting for the object to be deleted: too old resource version:
kubectl get nodes發現node失聯:
但是發現能ssh到失聯的node上去,於是重啟kubelet
systemctl restart kubelet.service
發現沒用。於是關閉交換空間
swapoff -a
發現錯誤解決,node恢復連接,刪不掉的pod自動沒有了
備注:查看node kubelet日志:
journalctl -f -u kubelet
原因:集群斷電重啟后自動打開了交換空間,而kubernetes需要關閉交換空間 swapoff -a