原文:記錄一次線上組件崩潰的解決過程

馬上就要離職了,想想工作中有些東西還是需要沉淀下來的,不僅僅要沉淀到心里,因為年紀大了 ,很容易忘記,不是有句話么,好記性不如爛筆頭。 分析這個bug之前先說點別的。 解決bug的大致思路 我覺的解bug和醫生看病是一樣的,中醫看病講究望聞問切。軟件出了毛病也按這個套路來,但是不需要聞。 望。觀察表面現象,server端出了問題還是client端 現象是什么 log里記錄了什么 問。詢問客戶最近 ...

2017-06-20 14:27 3 3254 推薦指數:

查看詳情

一次線上崩潰問題的排查過程

大家好,我是雨樂! 前幾天,突然收到報警,線上服務崩潰,然后自動重啟。 由於正值雙十一期間,業務以穩定為主,線上服務崩潰,這可不是一件小事,趕緊登陸線上服務器,分析原因,迅速解決。 借助這篇文章,記錄下整個崩潰的分析和解決過程。 收到報警 上午上班后,正在划水,突然收到郵件報警 ...

Wed Nov 10 23:54:00 CST 2021 0 811
一次asp.net core 線上崩潰解決總結

1.首先要先准備好環境,安裝lldb 工具 要安裝3.9版本的,因為每個版本對應dnc版本不一樣,3.9的支持2.2 版本,然后確定分析的機器里dnc 版本和線上的生產環境是否一致,自己安裝比較費勁,可以使用一些已經安裝好的docker鏡像來進行分析更簡單一點 2.在生產環境生成dump文件 ...

Fri Feb 28 19:31:00 CST 2020 2 815
一次線上FullGC問題記錄

​ 標題采自:英雄聯盟-瑞文:斷劍重鑄之日,騎士歸來之時! 斷劍 ​ 前兩天早上在擠地鐵的時候看到小組群里,主管發了好多消息,打開來一看,說是XX項目自從22號發版后,每天晚上就瘋狂Full GC ...

Fri Dec 07 19:40:00 CST 2018 3 854
一次線上OOM過程的排查

可用。於是我們對服務器上的狀況進行了排查。 二.排查問題的過程 在這次的問題排查主要是圍繞JVM的內存使用情況,生 ...

Thu Nov 08 22:34:00 CST 2018 0 1460
Linux(2)---記錄一次線上服務 CPU 100%的排查過程

Linux(2)---記錄一次線上服務 CPU 100%的排查過程 當時產生CPU飆升接近100%的原因是因為項目中的websocket時時斷開又重連導致CPU飆升接近100% 。如何排查的呢 是通過日志輸出錯誤信息: 得知websocket時時重新 連接的信息,然后找到原因 解決 ...

Fri Nov 23 05:52:00 CST 2018 0 1521
【JVM】記錄一次線上SWAP偏高告警的故障分析過程

近期遇到一個堆外內存導致swap飆高的問題,這類問題比較罕見,因此將整個排查過程記錄下來了 現象描述 最近1周線上服務器時不時出現swap報警(swap超過內存10%時觸發報警,內存是4G,因此swap超過400M會觸發報警),每次都是童鞋們通過重啟tomcat解決的;但導致的根本原因 ...

Wed May 15 22:20:00 CST 2019 0 725
原創 記錄一次線上Mysql慢查詢問題排查過程

背景 前段時間收到運維反饋,線上Mysql數據庫凌晨時候出現慢查詢的報警,並把原始sql發了過來: 表數據量200W左右,不是很大,而且是根據主鍵更新。 問題排查 排查Mysql數據庫 我看到sql后第一反應就是是不是數據庫出問題了,每個小時都有業務,偏偏白天業務高峰時間段 ...

Fri Mar 27 21:00:00 CST 2020 0 964
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM