原文:k8s node節點網絡插件工作正常、kubelet工作正常情況下,node狀態為NotReady,導致pod調度失敗的排查過程。

問題背景: 生產環境中部署的K S環境,一個業務pod無法異常退出,狀態為Termnation狀態,導致業務系統部分功能不可用。 排查過程: 使用kubectl describe pod pod name n namespaces查看pod狀態,發現pod調度失敗, 個node不滿足ready的狀態, 個node不滿足NodeSelector的要求 使用kubectl describe node ...

2021-07-19 15:53 0 149 推薦指數:

查看詳情

K8S線上集群排查,實測排查Node節點NotReady異常狀態

一,文章簡述 大家好,本篇是個人的第 2 篇文章。是關於在之前項目中,k8s 線上集群中 Node 節點狀態變成 NotReady 狀態導致整個 Node 節點中容器停止服務后的問題排查。 文章中所描述的是本人在項目中線上環境實際解決的,那除了如何解決該問題,更重要的是如何去排查這個問題 ...

Thu Oct 21 21:49:00 CST 2021 0 189
K8S線上集群排查,實測排查Node節點NotReady異常狀態

一,文章簡述 大家好,本篇是個人的第 2 篇文章。是關於在之前項目中,k8s 線上集群中 Node 節點狀態變成 NotReady 狀態導致整個 Node 節點中容器停止服務后的問題排查。 文章中所描述的是本人在項目中線上環境實際解決的,那除了如何解決該問題,更重要的是如何去排查這個問題 ...

Sat Feb 20 02:11:00 CST 2021 0 2263
排查 k8s 集群 master 節點無法正常工作的問題

搭建的是 k8s 高可用集群,用了 3 台 master 節點,2 台 master 節點宕機后,僅剩的 1 台無法正常工作。 運行 kubectl get nodes 命令出現下面的錯誤 注:k8s-api 對應的就是這台 master 服務器的本機 IP 地址。 運行 netstat ...

Wed Jan 08 06:15:00 CST 2020 0 4576
K8s Scheduler 在調度 pod 過程中遺漏部分節點的問題排查

問題現象 在TKE控制台上新建版本為v1.18.4(詳細版本號 < v1.18.4-tke.5)的獨立集群,其中,集群的節點信息如下: 有3個master node和1個worker node,並且worker 和 master在不同的可用區。 node ...

Thu May 13 18:01:00 CST 2021 0 236
K8SPOD節點狀態ContainerCreating原因排查

現象: 狀態一直是ContainerCreating。 查看pod日志: 可以看到是網絡問題。 原因是node之前反復添加過,添加之前需要清除下網絡 node上執行: 重新加入后問題即可解決。 可以看到狀態變為了Running。 ...

Tue Sep 10 01:07:00 CST 2019 0 3167
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM