原文:一次線上OOM過程的排查

https: blog.csdn.net qq article details 一.出現問題 在前一段時間日常環境很不穩定,前端調用mtop接口會出網絡異常或服務不存在的異常。查詢了服務器上的HSF會有偶爾掛死的情況,服務器上的接口服務都不可用。於是我們對服務器上的狀況進行了排查。 二.排查問題的過程 在這次的問題排查主要是圍繞JVM的內存使用情況,生成對象分布情況以及GC情況來討論的。中間有一些 ...

2018-11-08 14:34 0 1460 推薦指數:

查看詳情

一次線上OOM故障排查經過

轉貼:http://my.oschina.net/flashsword/blog/205266 本文是一次線上OOM故障排查的經過,內容比較基礎但是真實,主要是記錄一下,沒有OOM排查經驗的同學也可以參考。 現象 我們之前有一個計算作業。最近經常出現不穩定,無法正常響應的情況。具體表現 ...

Thu Mar 06 21:05:00 CST 2014 0 2844
一次OOM問題排查過程

上周運維反饋線上程序出現了OOM,程序日志中的輸出為 看線程名稱應該是tomcat的nio工作線程,線程在處理程序的時候因為無法在堆中分配更多內存出現了OOM,幸好JVM啟動參數配置了-XX:+HeapDumpOnOutOfMemoryError,使用MAT打開拿到的hprof文件進行分析 ...

Thu May 02 04:05:00 CST 2019 0 3052
一次線上接口超時的排查過程

1、事件還原 昨天下午,收到一個504的告警,顯然這是一個超時告警。當時由於手頭有其他事情,沒在意,就只是瞄了一眼,但是引起告警的方法很熟悉,是我寫的,第一反應有點詫異。 詫異之后,繼續處理手頭的工作。 一小時過后,又收到同樣的告警,顯然不是偶爾,肯定是哪兒出問題了,於是開始排查。 報警 ...

Sun Sep 29 08:17:00 CST 2019 2 1588
一次線上內存泄漏問題的排查過程

近期需要對公司的接口做線上的巡查監控,需要寫一個腳本放到服務器上,定時運行腳本監測線上接口是否正常。測試的接口不是HTTP協議,而是公司基於TCP協議開發的私有協議,因此不能直接用現成的一些接口測試工具,需要自己寫代碼來調用接口。由於是私有協議,為了方便各業務項目進行通信,開發部門統一提供了一個 ...

Mon Jul 08 22:31:00 CST 2019 0 637
一次線上崩潰問題的排查過程

大家好,我是雨樂! 前幾天,突然收到報警,線上服務崩潰,然后自動重啟。 由於正值雙十一期間,業務以穩定為主,線上服務崩潰,這可不是一件小事,趕緊登陸線上服務器,分析原因,迅速解決。 借助這篇文章,記錄下整個崩潰的分析和解決過程。 收到報警 上午上班后,正在划水,突然收到郵件報警 ...

Wed Nov 10 23:54:00 CST 2021 0 811
一次 android 線上 oom 問題

背景 公司的主打產品是一款跨平台的 App,我的部門負責為它提供底層的 sdk 用於數據傳輸,我負責的是 Adnroid 端的 sdk 開發。 sdk 並不直接加載在 App 主進程,而是隔離在一 ...

Mon Nov 29 17:54:00 CST 2021 1 297
一次線上 OOM 和性能優化

大家好,我是鴨血粉絲(大家會親切的喊我 「阿粉」),是一位喜歡吃鴨血粉絲的程序員,回想起之前線上出現 OOM 的場景,畢竟當時是第一次遇到這么 緊臟 的大事,要好好記錄下來。 1 事情回顧 在某次周五,通過 Grafana 監控,發現線上環境突然出現CPU和內存飆升的情況: 但是看到網絡 ...

Thu Jan 02 05:44:00 CST 2020 1 973
OOM】記一次線上OOM解決全流程

一、OOM背景   疫情期間,大家都開始了遠程辦公。剛開始不適應,最后感覺還挺好的,不用每天擠地鐵,住8平米的出租屋。   忽然有一天,系統報警郵件來了,運維也在群里艾特我,系統OOM了。其實寫Java的同學如果自己負責的系統出現了OOM,是很尷尬的事情。   畢竟也是骨灰級玩家了,不慌不忙 ...

Mon Feb 24 21:03:00 CST 2020 1 1271
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM