一、內存模型及分區
JVM 是可運行 Java 代碼的假想計算機 ,包括一套字節碼指令集、一組寄存器、一個棧、一個垃圾回收,堆 和 一個存儲方法域。JVM 是運行在操作系統之上的,它與硬件沒有直接的交互。
JVM 分為堆區和棧區,還有方法區,初始化的對象放在堆里面,引用放在棧里面,class 類信息常量池(static 常量和 static 變量)等放在方法區。
1.1、棧(Stack-線程私有)
1.1.1 棧的結構是棧幀組成的,調用一個方法就壓入一幀,幀上面存儲局部變量表,操作數棧,方法出口等信息,每一個方法從調用直至執行完成的過程,就對應着一個棧幀在虛擬機棧中入棧到出棧的過程。局部變量表存放的是 8 大基礎類型加上一個引用類型,所以還是一個指向地址的指針。操作數棧的作用主要用來存儲運算結果以及運算的操作數,它不同於局部變量表通過索引來訪問,而是壓棧和出棧的方式。
棧幀(Stack Frame)是用來存儲數據和部分過程結果的數據結構,同時也被用來處理動態鏈接(Dynamic Linking)、 方法返回值和異常分派( Dispatch Exception)。棧幀隨着方法調用而創建,隨着方法結束而銷毀——無論方法是正常完成還是異常完成(拋出了在方法內未被捕獲的異常)都算作方法結束。
1.1.2 JVM為每個線程創建一個棧,用於存儲該線程執行方法的信息(實際參數、局部變量等),與線程的生命周期相同。
1.2、堆(Heep-線程共享)---運行時數據區
1.2.1 是被線程共享的一塊內存區域,創建的對象和數組都保存在 Java 堆內存中,也是垃圾收集器進行垃圾收集的最重要的內存區域。由於現代 VM 采用分代收集算法, 因此 Java 堆從 GC 的角度還可以細分為: 新生代(Eden 區、From Survivor 區和 To Survivor 區)和老年代。
1.2.2 JVM只有一個堆,被所有線程所共享。
1.2.3 堆是一個不連續的存儲空間,分配靈活但速度慢。
1.3、方法區/永久代(線程共享):
1.3.1 主要是存儲類信息,常量池(static 常量和 static 變量),編譯后的代碼(字節碼)等數據 (永遠不變或唯一的內容) 。
1.3.2 我們常說的永久代(Permanent Generation), 用於存儲被 JVM 加載的類信息、常量、靜態變量、即時編譯器編譯后的代碼等數據. HotSpot VM把GC分代收集擴展至方法區, 即使用Java堆的永久代來實現方法區, 這樣 HotSpot 的垃圾收集器就可以像管理 Java 堆一樣管理這部分內存,而不必為方法區開發專門的內存管理器(永久帶的內存回收的主要目標是針對常量池的回收和類型的卸載, 因此收益一般很小)
1.3.3 運行時常量池(Runtime Constant Pool)是方法區的一部分。Class 文件中除了有類的版本、字段、方法、接口等描述等信息外,還有一項信息是常量池(Constant Pool Table),用於存放編譯期生成的各種字常量和符號引用,這部分內容將在類加載后存放到方法區的運行時常量池中。 Java 虛擬機對 Class 文件的每一部分(自然也包括常量池)的格式都有嚴格的規定,每一個字節用於存儲哪種數據都必須符合規范上的要求,這樣才會被虛擬機認可、裝載和執行。
1.3.4 JVM只有一個方法區,被所有線程共享。
1.3.5 方法區實際上也是堆,只是用來存儲類、常量相關的信息。
1.3.6 版本變換
-
在JDK1.7以前HotSpot虛擬機使用永久代來實現方法區,永久代的大小在啟動JVM時可以設置一個固定值(-XX:MaxPermSize),不可變;
-
在JDK1.7中 存儲在永久代的部分數據就已經轉移到Java Heap或者Native memory。譬如符號引用(Symbols)轉移到了native memory,原本存放在永久代的字符常量池移出。但永久代仍存在於JDK 1.7中,並沒有完全移除。
-
JDK1.8中進行了較大改動
- 移除了永久代(PermGen),替換為元空間(Metaspace);
- 永久代中的 class metadata 轉移到了 native memory(本地內存,而不是虛擬機);
- 永久代中的 interned Strings 和 class static variables 轉移到了 Java heap;
- 永久代參數 (PermSize MaxPermSize) -> 元空間參數(MetaspaceSize MaxMetaspaceSize)
1.4、本地方法棧(線程私有)
1.5、程序計數器(線程私有)
一塊較小的內存空間, 是當前線程所執行的字節碼的行號指示器,每條線程都要有一個獨立的程序計數器,這類內存也稱為“線程私有”的內存。正在執行 java 方法的話,計數器記錄的是虛擬機字節碼指令的地址(當前指令的地址)。如果還是 Native 方法,則為空。這個內存區域是唯一一個在虛擬機中沒有規定任何 OutOfMemoryError 情況的區域。
二、Minor GC、Major GC、Full GC
2.1 Minor GC
新生代 GC(Minor GC):從年輕代空間(包括 Eden 和 Survivor 區域)回收內存被稱為 Minor GC,因為 Java 對象大多都具備朝生夕滅的特性,所以 Minor GC 非常頻繁,一般回收速度也比較快。這一定義既清晰又易於理解。但是,當發生Minor GC事件的時候,有一些有趣的地方需要注意到:
2.1.1 當 JVM 無法為一個新的對象分配空間時會觸發 Minor GC,比如當 Eden 區滿了。所以分配率越高,越頻繁執行 Minor GC。
2.1.2 內存池被填滿的時候,其中的內容全部會被復制,指針會從0開始跟蹤空閑內存。Eden 和 Survivor 區進行了標記和復制操作,取代了經典的標記、掃描、壓縮、清理操作。所以 Eden 和 Survivor 區不存在內存碎片。寫指針總是停留在所使用內存池的頂部。
2.1.3 執行 Minor GC 操作時,不會影響到永久代。從永久代到年輕代的引用被當成 GC roots,從年輕代到永久代的引用在標記階段被直接忽略掉。
2.1.4 所有的 Minor GC 都會觸發“全世界的暫停(stop-the-world)”,停止應用程序的線程。對於大部分應用程序,停頓導致的延遲都是可以忽略不計的。其中的真相就 是,大部分 Eden 區中的對象都能被認為是垃圾,永遠也不會被復制到 Survivor 區或者老年代空間。如果正好相反,Eden 區大部分新生對象不符合 GC 條件,Minor GC 執行時暫停的時間將會長很多。
所以 Minor GC 的情況就相當清楚了——每次 Minor GC 會清理年輕代的內存。
2.1.5 觸發機制:當年輕代滿時就會觸發Minor GC,這里的年輕代滿指的是Eden代滿,Survivor滿不會引發GC。
2.2 Major GC
Major GC清理Tenured區,用於回收老年代,出現Major GC通常會出現至少一次Minor GC。
Major GC的觸發條件:當年老代空間不夠用的時候,虛擬機會使用“標記—清除”或者“標記—整理”算法清理出連續的內存空間,分配對象使用。
注意:也有認為是和full GC是等價的,收集整個GC堆。但因為HotSpot VM發展了這么多年,外界對各種名詞的解讀已經完全混亂了,當有人說“major GC”的時候一定要問清楚他想要指的是上面的old GC(只清理老年代)還是 full GC。
2.3 Full GC
Full GC是針對整個新生代、老生代、元空間(metaspace,java8以上版本取代perm gen)的全局范圍的GC。Full GC不等於Major GC,也不等於Minor GC+Major GC,發生Full GC需要看使用了什么垃圾收集器組合,才能解釋是什么樣的垃圾回收。
Full GC觸發條件:
2.3.1 調用System.gc時,系統建議執行Full GC,但是不必然執行
2.3.2 老年代空間不足
2.3.3 方法去空間不足
2.3.4 通過Minor GC后進入老年代的平均大小大於老年代的可用內存
2.3.5 由Eden區、From Space區向To Space區復制時,對象大小大於To Space可用內存,則把該對象轉存到老年代,且老年代的可用內存小於該對象大小
三、JVM運行時內存

3.1、新生代
是用來存放新生的對象。一般占據堆的 1/3 空間。由於頻繁創建對象,所以新生代會頻繁觸發MinorGC 進行垃圾回收。新生代又分為 Eden 區、ServivorFrom、ServivorTo 三個區。
3.1.1 Eden 區
Java 新對象的出生地(如果新創建的對象占用內存很大,則直接分配到老年代)。當 Eden 區內存不夠的時候就會觸發 MinorGC,對新生代區進行一次垃圾回收。
3.1.2 ServivorFrom 區
上一次 GC 的幸存者,作為這一次 GC 的被掃描者。
3.1.3 ServivorTo區
保留了一次 MinorGC 過程中的幸存者。
3.1.4 MinorGC 的過程(復制->清空->互換)
MinorGC 采用復制算法。
3.1.4.1 eden、servivorFrom 復制到 ServivorTo,年齡+1
首先,把 Eden 和 ServivorFrom 區域中存活的對象復制到 ServivorTo 區域(如果有對象的年齡已經達到了老年的標准,則賦值到老年代區),同時把這些對象的年齡+1(如果 ServivorTo 不夠位置了就放到老年區);虛擬機會給每個對象定義一個對象年齡(Age)計數器,對象在Survivor區中每“熬過”一次GC,年齡就會+1。待到年齡到達一定歲數(默認是15歲),虛擬機就會將對象移動到年老代。
3.1.4.2 清空 eden、servivorFrom
然后,清空 Eden 和 ServivorFrom 中的對象;
3.1.4.3 ServivorTo 和 ServivorFrom 互換
最后,ServivorTo 和 ServivorFrom 互換,原 ServivorTo 成為下一次 GC 時的 ServivorFrom區。
3.2、老年代
主要存放應用程序中生命周期長的內存對象。
老年代的對象比較穩定,所以 MajorGC 不會頻繁執行。在進行 MajorGC 前一般都先進行了一次 MinorGC,使得有新生代的對象晉身入老年代,導致空間不夠用時才觸發。當無法找到足夠大的連續空間分配給新創建的較大對象時也會提前觸發一次 MajorGC 進行垃圾回收騰出空間。
MajorGC 采用標記清除算法:首先掃描一次所有老年代,標記出存活的對象,然后回收沒有標記的對象。MajorGC 的耗時比較長,因為要掃描再回收。MajorGC 會產生內存碎片,為了減少內存損耗,我們一般需要進行合並或者標記出來方便下次直接分配。當老年代也滿了裝不下的時候,就會拋出 OOM(Out of Memory)異常。
3.3、永久代
指內存的永久保存區域,主要存放 Class 和 Meta(元數據)的信息,Class 在被加載的時候被放入永久區域,它和和存放實例的區域不同,GC 不會在主程序運行期對永久區域進行清理。所以這也導致了永久代的區域會隨着加載的 Class 的增多而脹滿,最終拋出 OOM 異常。
在 Java8 中,永久代已經被移除,被一個稱為“元數據區”(元空間)的區域所取代。元空間的本質和永久代類似,元空間與永久代之間最大的區別在於:元空間並不在虛擬機中,而是使用本地內存。因此,默認情況下,元空間的大小僅受本地內存限制。類的元數據放入 native memory, 字符串池和類的靜態變量放入 java 堆中,這樣可以加載多少類的元數據就不再由MaxPermSize 控制, 而由系統的實際可用空間來控制。
四、Java 垃圾回收機制
4.1、簡介:

4.2、如何確定是否是垃圾(對象是否存活)
4.2.1 引用計數法
在 Java 中,引用和對象是有關聯的。如果要操作對象則必須用引用進行。因此,很顯然一個簡單的辦法是通過引用計數來判斷一個對象是否可以回收。簡單說,即一個對象如果沒有任何與之關聯的引用,即他的引用計數為 0,則說明對象不太可能再被用到,那么這個對象就是可回收對象。
引用計數法有一個缺陷就是無法解決循環引用問題,也就是說當對象 A 引用對象 B,對象B 又引用者對象 A,那么此時 A,B 對象的引用計數器都不為零,也就造成無法完成垃圾回收,所以主流的虛擬機都沒有采用這種算法。
4.2.2 可達性算法(引用鏈法)
為了解決引用計數法的循環引用問題,Java 使用了可達性分析的方法。通過一系列的“GC roots”對象作為起點搜索。如果在“GC roots”和一個對象之間沒有可達路徑,則稱該對象是不可達的。要注意的是,不可達對象不等價於可回收對象,不可達對象變為可回收對象至少要經過兩次標記過程。兩次標記后仍然是可回收對象,則將面臨回收。
如果對象在可達性分析中沒有與 GC Root 的引用鏈,那么此時就會被第一次標記並且進行一次篩選,篩選的條件是是否有必要執行 finalize()方法。當對象沒有覆蓋 finalize()方法或者已被虛擬機調用過,那么就認為是沒必要的。如果該對象有必要執行 finalize()方法,那么這個對象將會放在一個稱為 F-Queue 的對隊列中,虛擬機會觸發一個 Finalize()線程去執行,此線程是低優先級的,並且虛擬機不會承諾一直等待它運行完,這是因為如果 finalize()執行緩慢或者發生了死鎖,那么就會造成 FQueue 隊列一直等待,造成了內存回收系統的崩潰。GC 對處於 F-Queue 中的對象進行第二次被標記,這時,該對象將被移除”即將回收”集合,等待回收。
在 java 中可以作為 GC Roots 的對象有以下幾種:
4.2.2.1 虛擬機棧中引用的對象
4.2.2.2 方法區類靜態屬性引用的對象
4.2.2.3 方法區常量池引用的對象
4.2.2.4 本地方法棧 JNI 引用的對象
4.3 垃圾收集方法
4.3.1 標記清除算法(Mark-Sweep)
最基礎的垃圾回收算法,分為兩個階段,標注和清除。標記階段標記出所有需要回收的對象,清除階段回收被標記的對象所占用的空間。如圖
這種方法很簡單,但是會有兩個主要問題:
1.效率不高,標記和清除的效率都很低;
2.會產生大量不連續的內存碎片,導致以后程序在分配較大的對象時,由於沒有充足的連續內存而提前觸發一次 GC 動作。
4.3.2 復制算法(copying)
為了解決 Mark-Sweep 算法內存碎片化的缺陷而被提出的算法。按內存容量將內存划分為等大小的兩塊。每次只使用其中一塊,當這一塊內存滿后將尚存活的對象復制到另一塊上去,把已使用的內存清掉,如圖:
這種算法雖然實現簡單,內存效率高,不易產生碎片,但是最大的問題是可用內存被壓縮到了原本的一半。且存活對象增多的話,Copying 算法的效率會大大降低。
於是將該算法進行了改進,內存區域不再是按照 1:1 去划分,而是將內存划分為8:1:1 三部分,較大那份內存交 Eden 區,其余是兩塊較小的內存區叫 Survior 區。每次都會優先使用 Eden 區,若 Eden 區滿,就將對象復制到第二塊內存區上,然后清除 Eden 區,如果此時存活的對象太多,以至於 Survivor 不夠時,會將這些對象通過分配擔保機制復制到老年代中。(java 堆又分為新生代和老年代)。
4.3.3 標記整理算法(Mark-Compact)
結合了以上兩個算法,該算法主要是為了解決標記-清除,產生大量內存碎片的問題;當對象存活率較高時,也解決了復制算法的效率問題。它的不同之處就是在清除對象的時候現將可回收對象移動到一端,然后清除掉端邊界以外的對象,這樣就不會產生內存碎片了。
4.3.4 分代收集算法
分代收集法是目前大部分 JVM 所采用的方法,其核心思想是根據對象存活的不同生命周期將內存划分為不同的域,一般情況下將 GC 堆划分為老生代(Tenured/Old Generation)和新生代(YoungGeneration)。老生代的特點是每次垃圾回收時只有少量對象需要被回收,新生代的特點是每次垃圾回收時都有大量垃圾需要被回收,因此可以根據不同區域選擇不同的算法。
4.3.4.1 新生代與復制算法
目前大部分 JVM 的 GC 對於新生代都采取 Copying 算法,因為新生代中每次垃圾回收都要回收大部分對象,即要復制的操作比較少,但通常並不是按照 1:1 來划分新生代。一般將新生代划分為一塊較大的 Eden 空間和兩個較小的 Survivor 空間(From Space, To Space),每次使用Eden 空間和其中的一塊 Survivor 空間,當進行回收時,將該兩塊空間中還存活的對象復制到另一塊 Survivor 空間中。
4.3.4.2 老年代與標記整理算法
而老年代因為每次只回收少量對象,因而采用 Mark-Compact 算法。
4.3.5 GC 分代收集算法 VS 分區收集算法
當前主流 VM 垃圾收集都采用”分代收集”(Generational Collection)算法, 這種算法會根據對象存活周期的不同將內存划分為幾塊, 如 JVM 中的 新生代、老年代、永久代,這樣就可以根據各年代特點分別采用最適當的 GC 算法.
在新生代-復制算法: 每次垃圾收集都能發現大批對象已死, 只有少量存活. 因此選用復制算法, 只需要付出少量存活對象的復制成本就可以完成收集.
在老年代-標記整理算法: 因為對象存活率高、沒有額外空間對它進行分配擔保, 就必須采用“標記—清理”或“標記—整理”算法來進行回收, 不必進行內存復制, 且直接騰出空閑內存.
4.4 GC 垃圾收集器
Java 堆內存被划分為新生代和年老代兩部分,新生代主要使用復制和標記-清除垃圾回收算法;年老代主要使用標記-整理垃圾回收算法,因此 java 虛擬中針對新生代和年老代分別提供了多種不同的垃圾收集器,JDK1.6 中 Sun HotSpot 虛擬機的垃圾收集器如下:

4.4.1 Serial 垃圾收集器(單線程、復制算法)
4.4.2 ParNew 垃圾收集器(Serial+多線程)
ParNew 垃圾收集器其實是 Serial 收集器的多線程版本,也使用復制算法,除了使用多線程進行垃圾收集之外,其余的行為和 Serial 收集器完全一樣,ParNew 垃圾收集器在垃圾收集過程中同樣也要暫停所有其他的工作線程。ParNew 收集器默認開啟和 CPU 數目相同的線程數,可以通過-XX:ParallelGCThreads 參數來限制垃圾收集器的線程數。【Parallel:平行的】 ParNew雖然是除了多線程外和Serial 收集器幾乎完全一樣,但是ParNew垃圾收集器是很多 java虛擬機運行在 Server 模式下新生代的默認垃圾收集器。
4.4.3 Parallel Scavenge 收集器(多線程復制算法、高效)
Parallel Scavenge 收集器也是一個新生代垃圾收集器,同樣使用復制算法,也是一個多線程的垃圾收集器,它重點關注的是程序達到一個可控制的吞吐量(Thoughput,CPU 用於運行用戶代碼的時間/CPU 總消耗時間,即吞吐量=運行用戶代碼時間/(運行用戶代碼時間+垃圾收集時間)),高吞吐量可以最高效率地利用 CPU 時間,盡快地完成程序的運算任務,主要適用於在后台運算而不需要太多交互的任務。自適應調節策略也是 ParallelScavenge 收集器與 ParNew 收集器的一個重要區別。
4.4.4 Serial Old 收集器(單線程標記整理算法 )
Serial Old 是 Serial 垃圾收集器年老代版本,它同樣是個單線程的收集器,使用標記-整理算法,這個收集器也主要是運行在 Client 默認的 java 虛擬機默認的年老代垃圾收集器。
1. 在 JDK1.5 之前版本中與新生代的 Parallel Scavenge 收集器搭配使用。
新生代 Serial 與年老代 Serial Old 搭配垃圾收集過程圖:
新生代 Parallel Scavenge 收集器與 ParNew 收集器工作原理類似,都是多線程的收集器,都使用的是復制算法,在垃圾收集過程中都需要暫停所有的工作線程。
新生代 ParallelScavenge/ParNew 與年老代 Serial Old 搭配垃圾收集過程圖:
4.4.5 Parallel Old 收集器(多線程標記整理算法)
Parallel Old 收集器是Parallel Scavenge的年老代版本,使用多線程的標記-整理算法,在 JDK1.6才開始提供。 在 JDK1.6 之前,新生代使用 ParallelScavenge 收集器只能搭配年老代的 Serial Old 收集器,只能保證新生代的吞吐量優先,無法保證整體的吞吐量, Parallel Old 正是為了在年老代同樣提供吞吐量優先的垃圾收集器,如果系統對吞吐量要求比較高,可以優先考慮新生代 Parallel Scavenge和年老代 Parallel Old 收集器的搭配策略。新生代 Parallel Scavenge 和年老代 Parallel Old 收集器搭配運行過程圖:

4.4.6 CMS 收集器(多線程標記清除算法)
Concurrent mark sweep(CMS)收集器是一種年老代垃圾收集器,其最主要目標是獲取最短垃圾回收停頓時間,和其他年老代使用標記-整理算法不同,它使用多線程的標記-清除算法。最短的垃圾收集停頓時間可以為交互比較高的程序提高用戶體驗。
-
初始標記:在這個階段,需要虛擬機停頓正在執行的任務,官方的叫法STW(Stop The Word)。這個過程從垃圾回收的"根對象"開始,只掃描到能夠和"根對象"直接關聯的對象,並作標記。所以這個過程雖然暫停了整個JVM,但是很快就完成了。
-
並發標記:這個階段緊隨初始標記階段,在初始標記的基礎上繼續向下追溯標記。並發標記階段,應用程序的線程和並發標記的線程並發執行,所以用戶不會感受到停頓
-
並發預清理:並發預清理階段仍然是並發的。在這個階段,虛擬機查找在執行並發標記階段新進入老年代的對象(可能會有一些對象從新生代晉升到老年代, 或者有一些對象被分配到老年代)。通過重新掃描,減少下一個階段"重新標記"的工作,因為下一個階段會Stop The World。
-
重新標記:這個階段會暫停虛擬機,收集器線程掃描在CMS堆中剩余的對象。掃描從"根對象"開始向下追溯,並處理對象關聯。
-
並發清理:清理垃圾對象,這個階段收集器線程和應用程序線程並發執行。
- 並發重置:這個階段,重置CMS收集器的數據結構,等待下一次垃圾回收。
CMS 收集器工作過程:

4.4.7 G1 收集器
