原文:一次“不負責任”的 K8s 網絡故障排查經驗分享

作者 駱冰利 來源 Erda 公眾號 某天晚上,客戶碰到了這樣的問題:K s 集群一直擴容失敗,所有節點都無法正常加入集群。在經過多番折騰無解后,客戶將問題反饋到我們這里,希望得到技術支持。該問題的整個排查過程比較有意思,本文對其中的排查思路及所用的方法進行了歸納整理並分享給大家,希望能夠對大家在排查此類問題時有些幫助和參考。 問題現象 運維同學在對客戶的 K s 集群進行節點擴容時,發現新增的 ...

2021-06-23 16:06 0 224 推薦指數:

查看詳情

k8s一次網絡不通故障

  k8s集群啟動es集群,啟動了4個副本,其中1個副本調度到node01,1個副本調度到node02   從主機無法ping通到node01的Pod可以同node02的Pod     查看node01的ip發現flanneld和docker的ip地址不在同一網段   重啟flanneld ...

Thu Jul 02 19:24:00 CST 2020 0 1730
Linux網絡故障排查

排查硬件網卡故障 ethtool ethN ip addr 查看網卡ip 網關設置 DNS狀況(dig,nslookup) 網絡排查 端口是否開放 Linux系統排查4——網絡篇 ...

Wed Jul 15 02:10:00 CST 2020 0 568
網絡故障排查步驟

1、ping 首先使用ping命令,使用快捷鍵win+R鍵,調出運行命令,然后輸出cmd,打開控制台。 在界面中使用ping+域名命令,在這里使用了baidu的域名,本地試用也可以使用local ...

Mon May 06 20:22:00 CST 2019 0 1479
一次bond引起的網絡故障

本案中3個關鍵服務器 物理服務器:192.168.6.63,簡稱P,(Physical server) KVM-VM:192.168.6.150,是物理服務器P上的一個KVM虛機,簡稱VM NAS:外 ...

Mon Apr 29 05:06:00 CST 2019 1 721
K8S集群安裝故障排查

問題1:kubeadm初始化安裝K8S集群失敗? 問題描述: W0601 16:17:29.317823 13912 strict.go:54] error unmarshaling configuration schema.GroupVersionKind{Group ...

Wed Jun 02 00:40:00 CST 2021 0 2555
k8s之記一次內部DNS無法解析的故障過程

  k8s部署了兩套環境命名空間分別為dev和test   但是進入命名空間為test的主機無法使用內部域名解析例如使用statesetful部署的Pod名為es-kibana-0 serviceName名為es-kibana   正常進入容器內部使用 ...

Fri Jun 19 23:52:00 CST 2020 0 2958
linux運維、架構之路-K8s故障排查

一、kubernetes故障排查 1、應用程序故障排查 ①主要針對Pod級別的, 非running狀態時使用describe查看Pod事件進行問題排查。describe也可以查看其他資源對象事件,如deployment、service等。 kubectl describe ...

Wed Dec 16 23:09:00 CST 2020 0 595
1個工具,助你提升K8S故障排查效率!

Kubernetes的故障排查一直困擾眾多運維團隊或DevOps,除了Kubernetes本身的復雜性之外,還有Kubernetes的工作負載是動態的原因。本文將介紹1個工具可以幫助你可視化K8S網絡和流量,以提升你的故障排查效率。 本文來自Rancher Labs 作為領先的多集群 ...

Tue Apr 21 18:25:00 CST 2020 0 788
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM