最近經常遇到jvm內存問題,覺得還是有必要整理下jvm內存的相關邏輯,這里只描述jvm堆內存,對外內存暫不闡述。
jvm內存簡圖
-
jvm內存分為堆內存和非堆內存,堆內存分為年輕代、老年代,非堆內存里只有個永久代。
-
年輕代分為生成區(Eden)和幸存區(Survivor),幸存區由FromSpace和Tospace兩部分組成,默認情況下,內存大小比例:Eden:FromSpace:ToSpace 為 8:1:1。
-
堆內存存放的是對象,垃圾收集器回收的就是這里的對象,不同區域的對象根據不同的GC算法回收,比如年輕代對應Minor GC,老年代對應Major GC。
-
非堆內存即永久代,也稱為方法區,存儲的是程序運行時長期存活的對象,比如類的元數據、方法、常量、屬性等。
-
在jdk1.8廢棄了永久代,使用元空間(MetaSpace)取而代之,元空間存儲的對象與永久代相同,區別是:元空間並不在jvm中,使用的是本地內存。
為什么移除永久代呢
為融合HotSpot JVM與JRockit VM(新JVM技術)而做出的改變,因為JRockit沒有永久代。
分代概念
首先,GC是Garbage Collection,即垃圾回收。
新生成的對象首先存放在生成區,當生成區滿了,觸發Minor GC,存活下來的對象轉移到Survivor0,即FromSpace,Survivor0區滿后觸發執行Minor GC,存活對象移動到Suvivor1區,即ToSpace,經過多次Minor GC仍然存活的對象轉移到老年代。
所以老年代存儲的是長期活動的對象,當老年代滿了會觸發Major GC。
Minor GC和Major GC是俗稱,有些情況下Major GC和Full GC是等價的,如果出發了Full GC,那么所有線程必須等待GC完成才能繼續(見GC分類和算法)。
分代原因
將對象根據存活概率進行分類,對存活時間長的對象,放到固定區,從而減少掃描垃圾時間及GC頻率。針對分類進行不同的垃圾回收算法,對算法揚長避短。
為什么幸存區分為大小相同的兩部分:S0,S1
主要為了解決碎片化,因為回收一部分對象后,剩余對象占用的內存不連續,也就是碎片化,過於嚴重的話,當前連續的內存不夠新對象存放就會觸發GC,這樣會提高GC的次數,降低性能,當S0 GC后存活對象轉移到S1后存活對象占用的就是連續的內存。
GC分類和相關算法
我們來看下GC分類,才能清楚什么時候觸發Full GC、和非Full GC,GC大致分為兩種:
- Partial GC:並不收集整個GC堆的模式,即可以理解為非Full GC
- Young GC:只收集young gen的GC
- Old GC:只收集old gen的GC。只有CMS有這個模式
- Mixed GC:收集整個young gen以及部分old gen的GC。只有G1有這個模式
- Full GC:收集整個堆,包括young gen、old gen、perm gen(如果存在的話)等所有部分的模式。
上面說的CMS和G1都是GC的算法,相關GC算法如下:
Serial GC算法:Serial Young GC + Serial Old GC (實際上它是全局范圍的Full GC);
Parallel GC算法:Parallel Young GC + 非並行的PS MarkSweep GC / 並行的Parallel Old GC(這倆實際上也是全局范圍的Full GC),選PS MarkSweep GC 還是 Parallel Old GC 由參數UseParallelOldGC來控制;
CMS算法:ParNew(Young)GC + CMS(Old)GC + Full GC for CMS算法;
G1 GC算法:Young GC + mixed GC(新生代,再加上部分老生代)+ Full GC for G1 GC算法(應對G1 GC算法某些時候的不趕趟,開銷很大);
GC觸發條件
-
Young GC:各種Young GC觸發的條件都是Eden區滿了。
-
Serial Old GC/PS MarkSweep GC/Parallel Old GC:當准備要觸發一次young GC時,如果發現統計數據說之前young GC的平均晉升大小比目前old gen剩余的空間大,則不會觸發young GC而是轉為觸發full GC。
-
Full GC for CMS:老年代使用比率超過某個值。
-
Full GC for G1 GC:Heap使用比率超過某個值。
-
如果有perm gen的話,要在perm gen分配空間但已經沒有足夠空間時,也要觸發一次full GC。
小結:不同算法對應的GC回收條件是不同的。
GC方式
標記-清除(Mark-Sweep)
GC分為兩個階段,標記和清除。首先標記所有可回收的對象,在標記完成后統一回收所有被標記的對象。同時會產生不連續的內存碎片,碎片過多會導致以后程序運行時需要分配較大對象時,無法找到足夠的連續內存,而不得已再次觸發GC。
紅色代表被標記的可回收對象,綠色代表存活對象
清除后如下:
復制(Copy)
將內存按容量划分為兩塊,每次只使用其中一塊。當這一塊內存用完了,就將存活的對象復制到另一塊上,然后再把已使用的內存空間一次清理掉。這樣使得每次都是對半個內存區回收,也不用考慮內存碎片問題,簡單高效。缺點需要兩倍的內存空間。
清除前后如下:
標記-整理(Mark-Compact)
也分為兩個階段,首先標記可回收的對象,再將存活的對象都向一端移動,然后清理掉邊界以外的內存。此方 法避免標記-清除算法的碎片問題,同時也避免了復制算法的空間問題。
一般年輕代中執行GC后,會有少量的對象存活,就會選用復制算法,只要付出少量的存活對象復制成本就可以 完成收集。而老年代中因為對象存活率高,沒有額外過多內存空間分配,就需要使用標記-清理或者標記-整理算法來進行回收。
清除前后如下:
GC算法參數
參數 | 描述 |
---|---|
-XX:+UseSerialGC | SerialGC算法 |
-XX:+UseParallelGC | ParallelGC算法 |
-XX:+UseParallelGCThreads=8 | ParallelGC算法線程數,同時有多少個線程進行垃圾回收,一般與CPU數量相等 |
-XX:+UseParallelOldGC | 指定老年代為ParallelGC算法 |
-XX:+UseConcMarkSweepGC | CMS算法(並發收集器) |
-XX:+UseCMSCompactAtFullCollection | 開啟內存空間壓縮和整理,防止過多內存碎片 |
-XX:CMSFullGCsBeforeCompaction=0 | 表示多少次Full GC后開始壓縮和整理,0表示每次Full GC后立即執行壓縮和整理 |
-XX:CMSInitiatingOccupancyFraction=80% | 表示老年代內存空間使用80%時開始執行CMS收集,防止過多的Full GC |
-XX:+UseG1GC | G1收集器 |
-XX:MaxTenuringThreshold=0 | 在年輕代經過幾次GC后還存活,就進入老年代,0表示直接進入老年代 |
OOM原因
1)老年代內存不足:java.lang.OutOfMemoryError:Javaheapspace
2)永久代內存不足:java.lang.OutOfMemoryError:PermGenspace
3)代碼bug,占用內存無法及時回收。
可以通過添加個參數-XX:+HeapDumpOnOutMemoryError,讓虛擬機在出現內存溢出異常時Dump出當前的內存堆轉儲快照以便事后分析。