1.pod出現不斷重啟
分析:1.pod里面沒有可運行的程序
2.coredns無法解釋內網域名服務,但可以ping通IP
分析:1.Linux內核版本變化導致coredns不兼容
3.pod的status出現magePullBackOff(gcr.io開頭的國內都是訪問不到的)
分析:1.tag寫錯
2.無法訪問倉庫
kubectl describle 結合kubectl log使用排查
4.Kubernetes版本與docker版本不兼容導致cgroup功能失效
5.pod noready狀態
kubectl get nodes 出現noready狀態
分析:
systemctl 命令查看 kubelet 狀態,然后
通過journalctl -u kubelet.service命令來查看kubelet服務的日志
排障思路:
基礎網絡-->etcd集群->api->網絡組件cni->coreDNS->基礎組件->其它SVC與PODS