原文:一次CMS GC問題排查過程(理解原理+讀懂GC日志)

這個是之前處理過的一個線上問題,處理過程斷斷續續,經歷了兩周多的時間,中間各種嘗試,總結如下。這篇文章分三部分: 問題的場景和處理過程 GC的一些理論東西 看懂GC的日志 先說一下問題吧 問題場景:線上機器在半夜會推送一個 M左右的數據,這個時候有個數據置換的過程,也就是說有 M 的數據在heap區域中,線上系統超時比較多,導致了很嚴重 嚴重程度就不說了 的問題。 問題原因:看日志,系統接口超時的 ...

2018-05-07 09:35 0 1362 推薦指數:

查看詳情

一次頻繁Full GC問題排查過程分享

問題描述 應用收到頻繁Full GC告警 問題排查 登錄到對應機器上去,查看GC日志,發現YGC一分鍾已經達到了15,比Full GC還要頻繁一些,其中Full GC平均10分鍾超過了4,如下圖 使用jstat -gcutil 5280 1000查看實時GC情況 ...

Wed Nov 07 17:31:00 CST 2018 4 8013
理解CMS GC日志

本文翻譯自: https://blogs.oracle.com/poonam/entry/understanding_cms_gc_logs 准備工作 JVM的GC日志的主要參數包括如下幾個: -XX:+PrintGC 輸出GC日志 -XX:+PrintGCDetails 輸出GC的詳細日志 ...

Thu Dec 22 06:01:00 CST 2016 2 5008
一次ygc越來越慢的問題排查過程

問題發現場景 某天突然收到線上應用的gc時間過長的告警,剛開始只有一台機器偶爾報一下,后續其他機器也紛紛告警,具體告警的閾值是應用10分鍾內ygc的總時長達到了6.6s。 初步排除過程 按照gc問題常規排查流程,還是先保留現場,jmap -dump:format=b,file ...

Mon Mar 11 18:03:00 CST 2019 4 1516
一次慢sql問題排查過程

背景說明   組織架構被拆分為多個微服務 需求: 一個輸入框 查詢 前后模糊查詢 人員信息(工號、姓名),前后模糊查詢 單位名稱。 跨庫平級查詢!! ...

Tue Dec 21 00:56:00 CST 2021 0 1023
一次OOM問題排查過程

上周運維反饋線上程序出現了OOM,程序日志中的輸出為 看線程名稱應該是tomcat的nio工作線程,線程在處理程序的時候因為無法在堆中分配更多內存出現了OOM,幸好JVM啟動參數配置了-XX:+HeapDumpOnOutOfMemoryError,使用MAT打開拿到的hprof文件進行分析 ...

Thu May 02 04:05:00 CST 2019 0 3052
一次線上內存泄漏問題排查過程

近期需要對公司的接口做線上的巡查監控,需要寫一個腳本放到服務器上,定時運行腳本監測線上接口是否正常。測試的接口不是HTTP協議,而是公司基於TCP協議開發的私有協議,因此不能直接用現成的一些接口測試工 ...

Mon Jul 08 22:31:00 CST 2019 0 637
一次線上崩潰問題排查過程

大家好,我是雨樂! 前幾天,突然收到報警,線上服務崩潰,然后自動重啟。 由於正值雙十一期間,業務以穩定為主,線上服務崩潰,這可不是一件小事,趕緊登陸線上服務器,分析原因,迅速解決。 借助這篇文章,記錄下整個崩潰的分析和解決過程。 收到報警 上午上班后,正在划水,突然收到郵件報警 ...

Wed Nov 10 23:54:00 CST 2021 0 811
一次故障排查過程

上周晚上,某環境 ES 出現阻塞, 運行緩慢。於是開始排查問題過程。 開始 思路:現象是阻塞,通常是 CPU 彪高,導致業務線程分配不到 CPU 時間片,或者內存吃緊,頻繁 GC 導致的 STW。 登錄到目標服務器,由於 ES 的用戶不是 LZ,因此找運維要了 root 權限,登錄到服務器 ...

Fri Jan 25 20:50:00 CST 2019 2 969
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM