1.pod出现不断重启
分析:1.pod里面没有可运行的程序
2.coredns无法解释内网域名服务,但可以ping通IP
分析:1.Linux内核版本变化导致coredns不兼容
3.pod的status出现magePullBackOff(gcr.io开头的国内都是访问不到的)
分析:1.tag写错
2.无法访问仓库
kubectl describle 结合kubectl log使用排查
4.Kubernetes版本与docker版本不兼容导致cgroup功能失效
5.pod noready状态
kubectl get nodes 出现noready状态
分析:
systemctl 命令查看 kubelet 状态,然后
通过journalctl -u kubelet.service命令来查看kubelet服务的日志
排障思路:
基础网络-->etcd集群->api->网络组件cni->coreDNS->基础组件->其它SVC与PODS