原文:一次FGC導致CPU飆高的排查過程

今天測試團隊反饋說,服務A的響應很慢,我在想,測試環境也會慢 於是我自己用postman請求了一下接口,真的很慢,竟然要 s左右,正常就 ms左右的。 於是去測試服務器看了一下,發現服務器負載很高,並且該服務A占了很高的cpu。先用top命令,看了load average,發現都到了 . 左右 雙核cpu 了,並且有一個java進程 占用cpu一直很高,如下圖: 於是,用命令jps l看了一下j ...

2020-06-01 10:25 4 1260 推薦指數:

查看詳情

一次JAVA進程導致Kubernetes節點CPU排查與解決

一、發現問題 在一次系統上線后,我們發現某幾個節點在長時間運行后會出現CPU持續飆升的問題,導致的結果就是Kubernetes集群的這個節點會把所在的Pod進行驅逐(調度);如果調度到同樣問題的節點上,也會出現Pod一直起不來的問題。我們嘗試了殺死Pod后手動調度的辦法(label ...

Fri Apr 10 22:12:00 CST 2020 1 1940
一次故障排查過程

上周晚上,某環境 ES 出現阻塞, 運行緩慢。於是開始排查問題的過程。 開始 思路:現象是阻塞,通常是 CPU導致業務線程分配不到 CPU 時間片,或者內存吃緊,頻繁 GC 導致的 STW。 登錄到目標服務器,由於 ES 的用戶不是 LZ,因此找運維要了 root 權限,登錄到服務器 ...

Fri Jan 25 20:50:00 CST 2019 2 969
一次奇怪的的bug排查過程

公司對底層基礎庫進行了重構,線上穩定跑了幾天,在查看訂單系統的log時,有幾條error信息非常的奇怪, 訂單有狀態機進行維護 已經被撤消的訂單不能再進行有其他操作,和狀態更改。 已 ...

Tue Nov 30 18:00:00 CST 2021 2 1723
一次生產環境docker服務CPU排查

今天早上,運維同學發現生產某個服務 CPU 持續,於是開始進行排查: 1、首先使用 top 命令,查看 CPU 占用的進程,得到進程 ID    2、根據上一步找到的進程ID,ps -ef | grep [進程ID] 找到對應程序    3、進入程序對應docker容器 ...

Sat Dec 25 01:25:00 CST 2021 0 1148
一次jvm瘋狂gc導致CPU的問題解決

記錄一次java虛擬機CPU的異常處理 線上web服務器不時的出現非常卡的情況,登錄服務器top命令發現服務器CPU非常的, 重啟tomcat之后CPU恢復正常,半天或者一天之后又會偶現同樣的問題。 解決問題首先要找到問題的爆發點,對於偶現的問題是非常難於定位的。 重啟服務器之后只能 ...

Wed Jan 01 00:16:00 CST 2020 0 2159
Linux(2)---記錄一次線上服務 CPU 100%的排查過程

Linux(2)---記錄一次線上服務 CPU 100%的排查過程 當時產生CPU飆升接近100%的原因是因為項目中的websocket時時斷開又重連導致CPU飆升接近100% 。如何排查的呢 是通過日志輸出錯誤信息: 得知websocket時時重新 連接的信息,然后找到原因 解決 ...

Fri Nov 23 05:52:00 CST 2018 0 1521
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM