原文:k8s node节点网络插件工作正常、kubelet工作正常情况下,node状态为NotReady,导致pod调度失败的排查过程。

问题背景: 生产环境中部署的K S环境,一个业务pod无法异常退出,状态为Termnation状态,导致业务系统部分功能不可用。 排查过程: 使用kubectl describe pod pod name n namespaces查看pod状态,发现pod调度失败, 个node不满足ready的状态, 个node不满足NodeSelector的要求 使用kubectl describe node ...

2021-07-19 15:53 0 149 推荐指数:

查看详情

K8S线上集群排查,实测排查Node节点NotReady异常状态

一,文章简述 大家好,本篇是个人的第 2 篇文章。是关于在之前项目中,k8s 线上集群中 Node 节点状态变成 NotReady 状态导致整个 Node 节点中容器停止服务后的问题排查。 文章中所描述的是本人在项目中线上环境实际解决的,那除了如何解决该问题,更重要的是如何去排查这个问题 ...

Thu Oct 21 21:49:00 CST 2021 0 189
K8S线上集群排查,实测排查Node节点NotReady异常状态

一,文章简述 大家好,本篇是个人的第 2 篇文章。是关于在之前项目中,k8s 线上集群中 Node 节点状态变成 NotReady 状态导致整个 Node 节点中容器停止服务后的问题排查。 文章中所描述的是本人在项目中线上环境实际解决的,那除了如何解决该问题,更重要的是如何去排查这个问题 ...

Sat Feb 20 02:11:00 CST 2021 0 2263
排查 k8s 集群 master 节点无法正常工作的问题

搭建的是 k8s 高可用集群,用了 3 台 master 节点,2 台 master 节点宕机后,仅剩的 1 台无法正常工作。 运行 kubectl get nodes 命令出现下面的错误 注:k8s-api 对应的就是这台 master 服务器的本机 IP 地址。 运行 netstat ...

Wed Jan 08 06:15:00 CST 2020 0 4576
K8s Scheduler 在调度 pod 过程中遗漏部分节点的问题排查

问题现象 在TKE控制台上新建版本为v1.18.4(详细版本号 < v1.18.4-tke.5)的独立集群,其中,集群的节点信息如下: 有3个master node和1个worker node,并且worker 和 master在不同的可用区。 node ...

Thu May 13 18:01:00 CST 2021 0 236
K8SPOD节点状态ContainerCreating原因排查

现象: 状态一直是ContainerCreating。 查看pod日志: 可以看到是网络问题。 原因是node之前反复添加过,添加之前需要清除下网络 node上执行: 重新加入后问题即可解决。 可以看到状态变为了Running。 ...

Tue Sep 10 01:07:00 CST 2019 0 3167
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM