原文:Kubernetes Pod故障归类与排查方法

Pod概念 Pod是kubernetes集群中最小的部署和管理的基本单元,协同寻址,协同调度。 Pod是一个或多个容器的集合,是一个或一组服务 进程 的抽象集合。 Pod中可以共享网络和存储 可以简单理解为一个逻辑上的虚拟机,但并不是虚拟机 。 Pod被创建后用一个UID来唯一标识,当Pod生命周期结束,被一个等价Pod替代时UID将重新生成。 Kubernetes Pod中最常用Docker容器 ...

2020-01-04 05:26 0 1752 推荐指数:

查看详情

Kubernetes系列:故障排查Pod状态为CreateContainerError

查看pod状态如下图所示,当前状态为CreateContainerError。 通过kube describe命令去查看Pod的状态发现没有提示任何错误。但是当通过命令kube logs查看pod的日志时,可以看到提示日志“Failed to update lock ...

Fri Feb 07 17:25:00 CST 2020 0 3878
Kubernetes故障排查(Trouble Shooting)方法总结

Blog:博客园 个人 本文部分内容源自网络,侵删。 概述 为了跟踪和发现在Kubernetes集群中运行的容器应用出现的问题,我们常用如下排查方法: 查看Kubernetes对象的当前运行时信息,特别是与对象关联的Event事件。这些事件记录了相关主题、发生时间、最近 ...

Sat Jun 27 06:06:00 CST 2020 0 517
kubernetes故障现场一之Orphaned pod

系列目录 问题描述:周五写字楼整体停电,周一再来的时候发现很多pod的状态都是Terminating,经排查是因为测试环境kubernetes集群中的有些节点是PC机,停电后需要手动开机才能起来.起来以后节点恢复正常,但是通过journalctl -fu kubelet查看日志不断 ...

Mon Jun 24 15:59:00 CST 2019 0 1678
Kubernetes Pod OOM 排查日记

一、发现问题 在一次系统上线后,我们发现某几个节点在长时间运行后会出现内存持续飙升的问题,导致的结果就是Kubernetes集群的这个节点会把所在的Pod进行驱逐OOM;如果调度到同样问题的节点上,也会出现Pod一直起不来的问题。我们尝试了杀死Pod后手动调度的办法(label),当然也可以排除 ...

Fri Aug 07 22:09:00 CST 2020 1 2809
kubernetes故障排查和节点维护(二)

系列目录 案例现场: 测试环境集群本来正常,突然间歇性地出现服务不能正常访问,过一会儿刷新页面又可以正常访问了.进入到服务所在的pod查看输出日志并没有发现异常.使用kubectl get node命令正好发现一个节点是NotReady状态 为了方便观察,使用kubectl ...

Sat Jun 22 04:08:00 CST 2019 0 1927
kubernetes flannel 网卡绑定错误,故障排查

kubernetes 新加了个node,状态Ready,但调度过去的任务,都执行异常 查看异常节点日志 `Error adding net work: open run/flannel/subnet.env no such file or directory` flannel 有问题 环境 ...

Sat Mar 02 22:35:00 CST 2019 0 2791
kubernetes中的pod不能访问域名问题排查

一、进入pod可以访问IP,不能访问域名 二、进入目标pod容器,查看/etc/resolv.conf 可以看到dns服务器IP为0.96.0.10,我们查看下系统的coredns pod容器信息 可以看到两个coredns pod位于两个node ...

Thu Jul 01 01:06:00 CST 2021 0 446
Kubernetes 无法删除pod实例的排查过程

今天在k8s集群创建pod时,执行了如下命令: 但是在创建过程中pod既然失败了, #使用如下命令想查看下失败的pod到底经历了什么,也没看出啥来, 就想着删除pod吧,但是执行命令后怎么都删除不了,心想是不是有什么关联服务没删除有依赖 ...

Sun Jun 03 21:32:00 CST 2018 0 6720
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM