原文:記一次jvm oom 導致docker容器頻繁重啟問題排查

應用部署在docker容器中,日志無報錯,docker卻有多次重啟記錄,Nginx監控報警 過程: .執行top命令查看內存占用情況 很干凈的容器,只有java進程在運行 .查看jvm情況 . 查看heap堆大小,可以使用jinfo flags PID 查看 或者使用jmap heap PID 查看結果更清晰些 . 查看垃圾回收情況jstat gcutil PID s 每三秒打印一次 修改啟動參數 ...

2020-10-12 16:51 0 879 推薦指數:

查看詳情

一次k8s pod頻繁重啟的優化之旅

關鍵詞:k8s、jvm、高可用 1.背景 最近有運維反饋某個微服務頻繁重啟,客戶映像特別不好,需要我們盡快看一下。 聽他說完我立馬到監控平台去看這個服務的運行情況,確實重啟了很多次。對於技術人員來說,這既是壓力也是動力,大多數時候我們都是沉浸在單調的業務開發中,對自我的提升有限 ...

Fri Sep 24 16:46:00 CST 2021 9 4560
一次OOM問題排查過程

上周運維反饋線上程序出現了OOM,程序日志中的輸出為 看線程名稱應該是tomcat的nio工作線程,線程在處理程序的時候因為無法在堆中分配更多內存出現了OOM,幸好JVM啟動參數配置了-XX:+HeapDumpOnOutOfMemoryError,使用MAT打開拿到的hprof文件進行分析 ...

Thu May 02 04:05:00 CST 2019 0 3052
一次容器CPU高占用問題排查

起因:發現docker中有兩個容器的CPU持續在百分之95以上運行了一晚上 執行命令:docker stats 發現這個兩個大兄弟一點沒歇滿負荷跑了一晚上,再這么下去怕不是要GG 容器里跑的是JAVA應用,JDK版本1.8 首先進入容器內部:docker exec -it 容器ID /bin ...

Tue Jun 02 22:28:00 CST 2020 0 1083
一次因jenkins重啟導致的項目全部丟失的問題

一次因jenkins重啟導致的項目全部丟失的問題 背景 今天下午部門反饋jenkins構建項目一直轉圈,點stop也不能停止。這個一直轉圈卡住是由於svn代碼從svn協議改變為https協議,路徑變了導致jenkins不能拉取代碼而一直阻塞在哪里。但我要重新構建啊,怎么辦 ...

Tue Sep 22 06:22:00 CST 2020 1 2423
一次JVM Metaspace溢出排查

多圖預警! 環境:系統測試(Windows Server/JRE8/tomcat7) 現象:應用運行幾天后,出現訪問超時,服務器cpu利用率居高不下 問題日志:OutOfMemoryError:MetaSpace 問題分析: 原因分析:MetaSpace是jvm ...

Thu Aug 24 20:06:00 CST 2017 0 13084
一次 android 線上 oom 問題

背景 公司的主打產品是一款跨平台的 App,我的部門負責為它提供底層的 sdk 用於數據傳輸,我負責的是 Adnroid 端的 sdk 開發。 sdk 並不直接加載在 App 主進程,而是隔離在一 ...

Mon Nov 29 17:54:00 CST 2021 1 297
一次上線部分docker不打日志的問題排查

一次正常的上線,發了幾台docker后,卻發現有的機器打了info.log里面有日志,有的沒有。排查問題開始: 第一:確認這台docker是否有流量進來,確認有流量進來。 第二:確認這台docker磁盤是否慢了,磁盤沒有滿。 第三:確認這台docker日志級別,確認 ...

Fri Jul 19 17:26:00 CST 2019 0 442
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM