原文:linux 3.10 一次softlock排查

x 架構。一個同事分析的crash,我在他基礎上再次協助分析,也沒有獲得進展,只是記錄一下分析過程。記錄是指備忘,萬一有人解決過,也好給我們點幫助。 有一次軟鎖,大多數cpu被鎖,log中第一個認為被鎖的cpu已經被沖掉了,直接敲入log,總共 個cpu,首先看到的是 cpu的堆棧,分析如下: cpu 在刷新tlb,它需要發送ipi給其他的cpu,簡單查看一下, static void csd l ...

2018-09-03 18:47 4 2049 推薦指數:

查看詳情

linux 3.10 的又一次hung

最近又遇到一次hung,dmesg中堆棧如下: 如果只盯着這個堆棧看,可以看出,網卡的 dev_watchdog 函數檢測到了eth4的queue 5 出現了 trans_timeout。 超時的檢測周期,不同的設備是不一樣的,intel的ixgbe對應的超時 ...

Thu Oct 11 23:17:00 CST 2018 0 1132
一次ARP病毒排查

XX公司網絡卡斷問題 1. 問題現象 2017年XX公司機關網絡出現幾次異常情況,並尋求內外部專家對異常情況進行診斷分析,均未找到原因,具體情況如下: ...

Thu Jan 18 17:04:00 CST 2018 0 2984
記錄一次問題排查

1. 問題描述:早上剛來上班,業務部門同事反應管理后台無法登錄 2. 問題排查定位 2.1 服務器排查 a. 接口是否可以調通:首先自己登陸后台,發現時好時壞,偶爾接口返回【系統忙】。我們系統接口異常調不通會返回系統忙 b. 服務是否死掉或者假死:連接服務器->查看Java ...

Tue Aug 03 02:08:00 CST 2021 0 260
關於頁面502的一次排查

一、場景: 系統 Deepin 15;php 5.5.33;nginx 1.9.9 二、狀況: 簡單的頁面輸出正常(比如 phpinfo();),跑公司的任何一個項目,均502 三、排查 1、查詢各種日志,包括 nginx.error.log、php_error.log ...

Wed Mar 23 04:38:00 CST 2016 1 1928
一次Redis錯誤排查經歷

日志集中式監控平台上線已經有一段時間,但是大部分情況下只是作為發布或者出問題時查看日志的便利工具使用。平時大家都不怎么主動上去看看。於是前幾天把應用的錯誤日志也加上郵件、Hi和短信報警,馬上就收到很多 ...

Sat Mar 18 06:56:00 CST 2017 0 2790
一次 nginx502問題排查

現象:通過nginx訪問,偶現502 排查步驟: 1、查看日志,無異常日志打印 2、抓包分析,發現發送http請求后,被源站直接發fin。 3、注釋代碼關鍵邏輯,測試。定位到是access.lua階段處理的問題。但因為沒有日志,代碼段太多,只能逐步排查 ...

Mon Dec 14 19:54:00 CST 2020 0 422
一次Commons-HttpClient的BindException排查

線上有個老應用,在流量增長的時候,HttpClient拋出了BindException。部分的StackTrace信息如下: Ephemeral Port Exhausted 先Google, ...

Wed Oct 16 19:56:00 CST 2019 0 411
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM