最近又遇到一次hung,dmesg中堆棧如下: 如果只盯着這個堆棧看,可以看出,網卡的 dev_watchdog 函數檢測到了eth4的queue 5 出現了 trans_timeout。 超時的檢測周期,不同的設備是不一樣的,intel的ixgbe對應的超時 ...
x 架構。一個同事分析的crash,我在他基礎上再次協助分析,也沒有獲得進展,只是記錄一下分析過程。記錄是指備忘,萬一有人解決過,也好給我們點幫助。 有一次軟鎖,大多數cpu被鎖,log中第一個認為被鎖的cpu已經被沖掉了,直接敲入log,總共 個cpu,首先看到的是 cpu的堆棧,分析如下: cpu 在刷新tlb,它需要發送ipi給其他的cpu,簡單查看一下, static void csd l ...
2018-09-03 18:47 4 2049 推薦指數:
最近又遇到一次hung,dmesg中堆棧如下: 如果只盯着這個堆棧看,可以看出,網卡的 dev_watchdog 函數檢測到了eth4的queue 5 出現了 trans_timeout。 超時的檢測周期,不同的設備是不一樣的,intel的ixgbe對應的超時 ...
XX公司網絡卡斷問題 1. 問題現象 2017年XX公司機關網絡出現幾次異常情況,並尋求內外部專家對異常情況進行診斷分析,均未找到原因,具體情況如下: ...
1. 問題描述:早上剛來上班,業務部門同事反應管理后台無法登錄 2. 問題排查定位 2.1 服務器排查 a. 接口是否可以調通:首先自己登陸后台,發現時好時壞,偶爾接口返回【系統忙】。我們系統接口異常調不通會返回系統忙 b. 服務是否死掉或者假死:連接服務器->查看Java ...
一、場景: 系統 Deepin 15;php 5.5.33;nginx 1.9.9 二、狀況: 簡單的頁面輸出正常(比如 phpinfo();),跑公司的任何一個項目,均502 三、排查 1、查詢各種日志,包括 nginx.error.log、php_error.log ...
一、java定位進程 在服務器中終端輸入命令:top 可以看到進程ID,為5421的cpu這列100多了。 記下這個數字:5421 二、定位問題進程對應的線程 然后在服務器中 ...
日志集中式監控平台上線已經有一段時間,但是大部分情況下只是作為發布或者出問題時查看日志的便利工具使用。平時大家都不怎么主動上去看看。於是前幾天把應用的錯誤日志也加上郵件、Hi和短信報警,馬上就收到很多 ...
現象:通過nginx訪問,偶現502 排查步驟: 1、查看日志,無異常日志打印 2、抓包分析,發現發送http請求后,被源站直接發fin。 3、注釋代碼關鍵邏輯,測試。定位到是access.lua階段處理的問題。但因為沒有日志,代碼段太多,只能逐步排查 ...
線上有個老應用,在流量增長的時候,HttpClient拋出了BindException。部分的StackTrace信息如下: Ephemeral Port Exhausted 先Google, ...