原文:一次“不负责任”的 K8s 网络故障排查经验分享

作者 骆冰利 来源 Erda 公众号 某天晚上,客户碰到了这样的问题:K s 集群一直扩容失败,所有节点都无法正常加入集群。在经过多番折腾无解后,客户将问题反馈到我们这里,希望得到技术支持。该问题的整个排查过程比较有意思,本文对其中的排查思路及所用的方法进行了归纳整理并分享给大家,希望能够对大家在排查此类问题时有些帮助和参考。 问题现象 运维同学在对客户的 K s 集群进行节点扩容时,发现新增的 ...

2021-06-23 16:06 0 224 推荐指数:

查看详情

k8s一次网络不通故障

  k8s集群启动es集群,启动了4个副本,其中1个副本调度到node01,1个副本调度到node02   从主机无法ping通到node01的Pod可以同node02的Pod     查看node01的ip发现flanneld和docker的ip地址不在同一网段   重启flanneld ...

Thu Jul 02 19:24:00 CST 2020 0 1730
Linux网络故障排查

排查硬件网卡故障 ethtool ethN ip addr 查看网卡ip 网关设置 DNS状况(dig,nslookup) 网络排查 端口是否开放 Linux系统排查4——网络篇 ...

Wed Jul 15 02:10:00 CST 2020 0 568
网络故障排查步骤

1、ping 首先使用ping命令,使用快捷键win+R键,调出运行命令,然后输出cmd,打开控制台。 在界面中使用ping+域名命令,在这里使用了baidu的域名,本地试用也可以使用local ...

Mon May 06 20:22:00 CST 2019 0 1479
一次bond引起的网络故障

本案中3个关键服务器 物理服务器:192.168.6.63,简称P,(Physical server) KVM-VM:192.168.6.150,是物理服务器P上的一个KVM虚机,简称VM NAS:外 ...

Mon Apr 29 05:06:00 CST 2019 1 721
K8S集群安装故障排查

问题1:kubeadm初始化安装K8S集群失败? 问题描述: W0601 16:17:29.317823 13912 strict.go:54] error unmarshaling configuration schema.GroupVersionKind{Group ...

Wed Jun 02 00:40:00 CST 2021 0 2555
k8s之记一次内部DNS无法解析的故障过程

  k8s部署了两套环境命名空间分别为dev和test   但是进入命名空间为test的主机无法使用内部域名解析例如使用statesetful部署的Pod名为es-kibana-0 serviceName名为es-kibana   正常进入容器内部使用 ...

Fri Jun 19 23:52:00 CST 2020 0 2958
linux运维、架构之路-K8s故障排查

一、kubernetes故障排查 1、应用程序故障排查 ①主要针对Pod级别的, 非running状态时使用describe查看Pod事件进行问题排查。describe也可以查看其他资源对象事件,如deployment、service等。 kubectl describe ...

Wed Dec 16 23:09:00 CST 2020 0 595
1个工具,助你提升K8S故障排查效率!

Kubernetes的故障排查一直困扰众多运维团队或DevOps,除了Kubernetes本身的复杂性之外,还有Kubernetes的工作负载是动态的原因。本文将介绍1个工具可以帮助你可视化K8S网络和流量,以提升你的故障排查效率。 本文来自Rancher Labs 作为领先的多集群 ...

Tue Apr 21 18:25:00 CST 2020 0 788
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM