原文:Linux(2)---記錄一次線上服務 CPU 100%的排查過程

Linux 記錄一次線上服務 CPU 的排查過程 當時產生CPU飆升接近 的原因是因為項目中的websocket時時斷開又重連導致CPU飆升接近 。如何排查的呢 是通過日志輸出錯誤信息: 得知websocket時時重新 連接的信息,然后找到原因 解決了。 當然這里幸好能通過日志大致分析出原因 那么我就在思考如果日志沒有告訴任何信息 但線上CPU還是接近 那么如何排查呢。所以學習了下排查過程。 通 ...

2018-11-22 21:52 0 1521 推薦指數:

查看詳情

原創 記錄一次線上Mysql慢查詢問題排查過程

背景 前段時間收到運維反饋,線上Mysql數據庫凌晨時候出現慢查詢的報警,並把原始sql發了過來: 表數據量200W左右,不是很大,而且是根據主鍵更新。 問題排查 排查Mysql數據庫 我看到sql后第一反應就是是不是數據庫出問題了,每個小時都有業務,偏偏白天業務高峰時間段 ...

Fri Mar 27 21:00:00 CST 2020 0 964
一次線上接口超時的排查過程

1、事件還原 昨天下午,收到一個504的告警,顯然這是一個超時告警。當時由於手頭有其他事情,沒在意,就只是瞄了一眼,但是引起告警的方法很熟悉,是我寫的,第一反應有點詫異。 詫異之后,繼續處理手頭的工作。 一小時過后,又收到同樣的告警,顯然不是偶爾,肯定是哪兒出問題了,於是開始排查。 報警 ...

Sun Sep 29 08:17:00 CST 2019 2 1588
一次線上服務CPU 100%的處理過程

告警 正在開會,突然釘釘告警聲響個不停,同時市場人員反饋客戶在投訴系統登不進了,報504錯誤。查看釘釘上的告警信息,幾台業務服務器節點全部報CPU超過告警閾值,達100%。 趕緊從會上下來,SSH登錄服務器,使用 top 命令查看,幾個Java進程CPU占用達到180%,190%,這幾 ...

Fri Jul 10 22:01:00 CST 2020 15 1844
一次線上內存泄漏問題的排查過程

近期需要對公司的接口做線上的巡查監控,需要寫一個腳本放到服務器上,定時運行腳本監測線上接口是否正常。測試的接口不是HTTP協議,而是公司基於TCP協議開發的私有協議,因此不能直接用現成的一些接口測試工具,需要自己寫代碼來調用接口。由於是私有協議,為了方便各業務項目進行通信,開發部門統一提供了一個 ...

Mon Jul 08 22:31:00 CST 2019 0 637
一次線上崩潰問題的排查過程

大家好,我是雨樂! 前幾天,突然收到報警,線上服務崩潰,然后自動重啟。 由於正值雙十一期間,業務以穩定為主,線上服務崩潰,這可不是一件小事,趕緊登陸線上服務器,分析原因,迅速解決。 借助這篇文章,記錄下整個崩潰的分析和解決過程。 收到報警 上午上班后,正在划水,突然收到郵件報警 ...

Wed Nov 10 23:54:00 CST 2021 0 811
一次FGC導致CPU飆高的排查過程

今天測試團隊反饋說,服務A的響應很慢,我在想,測試環境也會慢?於是我自己用postman請求了一下接口,真的很慢,竟然要2s左右,正常就50ms左右的。 於是去測試服務器看了一下,發現服務器負載很高,並且該服務A占了很高的cpu。先用top命令,看了load average,發現 ...

Mon Jun 01 18:25:00 CST 2020 4 1260
記錄一次Mysql死鎖排查過程

與鎖相關的源碼,但是如果我們能夠掌握基本的死鎖排查方法,對我們的日常開發還是大有裨益的。PS:本文不會介 ...

Mon Feb 20 22:30:00 CST 2017 0 3701
記錄一次http網絡超時的排查過程

微信公眾號:內核小王子 覺得可以的話歡迎關注 場景:公司對外網關對很多外部商戶開放,運行多年一直正常,昨天某一個客戶調用我們接口的時候頻繁報connectiontimeout,異常如下: 該異常來自於httpclient,原因是創建連接超時,也就是tcp進行三握手的時候失敗 ...

Tue May 21 22:50:00 CST 2019 0 829
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM