最近又遇到一次hung,dmesg中堆栈如下: 如果只盯着这个堆栈看,可以看出,网卡的 dev_watchdog 函数检测到了eth4的queue 5 出现了 trans_timeout。 超时的检测周期,不同的设备是不一样的,intel的ixgbe对应的超时 ...
x 架构。一个同事分析的crash,我在他基础上再次协助分析,也没有获得进展,只是记录一下分析过程。记录是指备忘,万一有人解决过,也好给我们点帮助。 有一次软锁,大多数cpu被锁,log中第一个认为被锁的cpu已经被冲掉了,直接敲入log,总共 个cpu,首先看到的是 cpu的堆栈,分析如下: cpu 在刷新tlb,它需要发送ipi给其他的cpu,简单查看一下, static void csd l ...
2018-09-03 18:47 4 2049 推荐指数:
最近又遇到一次hung,dmesg中堆栈如下: 如果只盯着这个堆栈看,可以看出,网卡的 dev_watchdog 函数检测到了eth4的queue 5 出现了 trans_timeout。 超时的检测周期,不同的设备是不一样的,intel的ixgbe对应的超时 ...
XX公司网络卡断问题 1. 问题现象 2017年XX公司机关网络出现几次异常情况,并寻求内外部专家对异常情况进行诊断分析,均未找到原因,具体情况如下: ...
1. 问题描述:早上刚来上班,业务部门同事反应管理后台无法登录 2. 问题排查定位 2.1 服务器排查 a. 接口是否可以调通:首先自己登陆后台,发现时好时坏,偶尔接口返回【系统忙】。我们系统接口异常调不通会返回系统忙 b. 服务是否死掉或者假死:连接服务器->查看Java ...
一、场景: 系统 Deepin 15;php 5.5.33;nginx 1.9.9 二、状况: 简单的页面输出正常(比如 phpinfo();),跑公司的任何一个项目,均502 三、排查 1、查询各种日志,包括 nginx.error.log、php_error.log ...
一、java定位进程 在服务器中终端输入命令:top 可以看到进程ID,为5421的cpu这列100多了。 记下这个数字:5421 二、定位问题进程对应的线程 然后在服务器中 ...
日志集中式监控平台上线已经有一段时间,但是大部分情况下只是作为发布或者出问题时查看日志的便利工具使用。平时大家都不怎么主动上去看看。于是前几天把应用的错误日志也加上邮件、Hi和短信报警,马上就收到很多 ...
现象:通过nginx访问,偶现502 排查步骤: 1、查看日志,无异常日志打印 2、抓包分析,发现发送http请求后,被源站直接发fin。 3、注释代码关键逻辑,测试。定位到是access.lua阶段处理的问题。但因为没有日志,代码段太多,只能逐步排查 ...
线上有个老应用,在流量增长的时候,HttpClient抛出了BindException。部分的StackTrace信息如下: Ephemeral Port Exhausted 先Google, ...