記一次 OutOfMemoryError: Java heap space 的排錯

本文轉載自查看原文 2018-08-14 15:27 3374 異常和排錯

1、情況概述

公司以前的某報名系統，項目啟動后，在經過用戶一段時間的使用之后，項目響應便開始變得極其緩慢，最后幾乎毫無反應。日志里輸出了一些似乎無關痛癢的異常，逐步修復，項目仍然出現這種情況，且 “項目啟動 -> 服務無響應” 這段時間並不穩定。直到在被反復折磨的這幾天里終於日志抓到了幾個異常，都是 javax.servlet.ServletException: java.lang.OutOfMemoryError: Java heap space

2、異常分析

JVM在啟動時默認設置可調配的內存空間為物理內存的1/64但小於1G，如果該空間的可用空間不足 2%，則拋出異常 OutOfMemoryError : Java heap space

項目中的日志模塊並沒能輸出可追溯的內存溢出，只能先排除一些猜想：

項目中幾乎不涉及大圖片加載，流不關閉等情況可以排除
項目中的對象模型並不復雜，JVM的初始參數足夠使用，所以單純調整JVM的參數設置不是個好辦法

在了解一下定位排錯的方式后，發現這么個東西：JVM Heap Dump（堆轉儲文件），Heap Dump 記錄了JVM中堆內存運行的情況，可以使用JDK提供的命令 jmap 生成，命令格式如下：

jmap -dump:live,format=b,file=heap-dump.bin <pid>

 
jmap -dump:live,format=b,file=heap-dump.bin <pid>

其中 pid 是JVM進程的id， heap-dump.bin 是生成的文件名稱，會在執行命令的目錄下生成該文件

注：在執行命令生成 dump 文件的過程中，曾報錯 "Insufficient memory or insufficient privileges to attach"，這是因為權限問題，調用系統服務啟動的tomcat和命令行執行命令看上去都在同個administrator用戶下，其實不然。解決方法是將 tomcat 以 startup.bat 啟動，再在命令行調用 jmap 即可。

分析 dump 文件的工具也有不少，這里使用了很多人都推薦的 Eclipse Memory Analyzer（MAT），這是 Eclipse 提供的一款用於 Heap Dump 文件的工具，有插件的形式，也可以獨立運行。

使用該工具打開生成的 dump 文件，緩慢分析載入后彈出選框，選擇 Leak Suspects Report：

Dominator Tree ：支配樹，列出Heap Dump中處於活躍狀態中的最大的幾個對象，默認按 retained size進行排序，因此很容易找到占用內存最多的對象。

使用工具的支配樹功能，看到如下：

兩個最高占比，而奇怪的在於之中：

總占比 29.85%，但是之中最大的對象竟然也就只占了 2.41%，怎么回事？仔細一看，除開前幾個對象之外，后面全部都是 Examinee 對象，數量之多，下面的黑體提示 " Total: 25 of 228,841 entries; 228,816"，剩余二十多萬個對象，展開一看全是 Examinee 和相關 Hibernate 的 EntityEntry 對象！那么造成內存溢出的問題就顯而易見了，內存中加載的數據量過於龐大，可能是循環引用造成的內存泄漏，也可能是對象產出過快垃圾回收無法及時處理。