本文轉載自哪些原因會導致JAVA進程退出?
導語
JAVA進程消失可能有哪些原因?
那我們就開一篇文章說一下這個問題,其實很easy的,無外乎三種情況。
- linux的OOM killer殺死
- JVM自身故障
- jvm的OOM導致進程退出(很罕見,我至今沒遇見過)
linux的OOM killer
Linux 內核有個機制叫OOM killer(Out-Of-Memory killer),該機制會監控那些占用內存過大,尤其是瞬間很快消耗大量內存的進程,為了防止內存耗盡而內核會把該進程殺掉。 因此,你發現java進程突然沒了,首先要懷疑是不是被linux的OOM killer給干掉了! 你可以去下面這個文件里翻
- 系統報錯日志:
/var/log/messages
你執行命令
egrep -i 'killed process' /var/log/messages
去日志里進行查詢。 當然,你也可以去內核日志里頭查詢。有時Linux系統或者系統上運行的java或者其它進程,會發生一些莫名其妙的問題,比如突然掛掉了,比如突然重啟等等。在軟件上找不到問題所在,此時我們應該懷疑硬件或者內核的問題,此時我們就可以使用 dmesg來查看:
dmesg | grep java
輸出如下
[5673702.665338] Out of memory: Kill process 29953 (java) score 431 or sacrifice child
[5673702.665338] Killed process 29953, UID 500, (java) total-vm:9805316kB, anon-rss:2344496kB, file-rss:128kB
完全是可以看到內核對進程做對操作。
JVM自身故障
當JVM發生致命錯誤導致崩潰時,會生成一個hs_err_pid_xxx.log這樣的文件,該文件包含了導致 JVM crash 的重要信息,我們可以通過分析該文件定位到導致 JVM Crash 的原因,從而修復保證系統穩定。 默認情況下,該文件是生成在工作目錄下的,當然也可以通過 JVM 參數指定生成路徑:
-XX:ErrorFile=/var/log/hs_err_pid<pid>.log
這個文件的內容主要有如下內容
- 日志頭文件
- 導致 crash 的線程信息
- 所有線程信息
- 安全點和鎖信息
- 堆信息
- 本地代碼緩存
- 編譯事件
- gc 相關記錄
- jvm 內存映射
- jvm 啟動參數
- 服務器信息
拿到這個文件后,不用說了,慢慢啃吧。說到這里,我要摸着良心說。這個文件巨復雜,如果要會讀這個文件,請下點功夫。
JVM的OOM
坦白說,我很少遇到因為JVM的OOM,導致java進程退出的情況。 因為,一般情況下,出現OOM異常,JVM的GC會進行回收,是不會導致JVM進程退出的。要真說唯一導致退出的情況,那就是內存泄漏,由於內存占用越來越大,結果。。。。 不過這種JVM的OOM導致的異常,很好排查。 因為,你注意兩個個參數
-XX:+HeapDumpOnOutOfMemoryError
-XX:HeapDumpPath=*/java.hprof;
然后去對應目錄找dump快照文件,接下來借助VisualVM這種可視化工具分析就行。很容易定位問題。
總結
綜上所述,正確回答是。先翻dump文件,dump如果沒有,翻hs_err_pid.log日志。如果還沒有,翻內核日志。