對於之前GC垃圾收集器的學習回憶【https://www.cnblogs.com/webor2006/p/10982448.html】一下都有哪些垃圾收集器:






接下來則會對CMS這種超級復雜的一個垃圾回收器進行一個學習,相比serial收集器還是parallel收集器,CMS這種收集器無論是在處理的階段上,還是在它的實現的復雜性上,都遠遠的要超過我們之前所接觸過的各種各樣的其它垃圾回收器,CMS的復雜性體現是多方面的:首先是它的源代碼是非常復雜,在新版本的JDK中已經將CMS這個垃圾回收器標記為@Deprecated的了, 對於為啥會將它標記為@Deprecated在國外twtter上有這么一個“段子”,原因是由於當時編寫CMS的人已經離職了,離職之后新接手的人是無論如何也看不懂CMS的C++源代碼,所以從側面也能反應CMS垃圾收集器是有多么的復雜。 對於我們而言不管代碼實現上是如何的復雜,首先得從原理上去理解CMS這種垃圾回收器到底是做什么事情的?到底有什么特點為啥它這么復雜?為啥如此復雜的回收器還能廣泛的存在於各個版本的JDK當中?像咱們實現用的JDK8也是可以正常去使用這個CMS回收器的,只要在JVM的啟動參數上加上相應CMS回收器也能正常使用了。CMS是隸屬於老年代的垃圾回收器,而新生代基本上都會采用復制算法,無論是serial收集器還是parallel收集器,所以在新生代中就會存在一個Eden區域和兩個Survivor【From、To】區域,而在老年代中一般是會使用標記-清除【mark-sweep】或標記-整理算法【mark-compact】,所以接下來會來理解CMS垃圾回收器的基本原理,而首先對它的理論的了解是助於我們能了解其原理的基礎,所以。。直接硬着頭皮來了解理論:
枚舉根節點:
當執行系統停頓下來之后,並不需要一個不漏地檢查完所有執行上下文和全局的引用位置,虛擬機應當是有辦法直接得知哪些地方存放着對象引用。在HotSpot的實現中,是使用一組稱為OopMap的數據結構來達到這個目的的。
安全點:
關於這個概念其實在之前理論的學習中是已經提到過的,回憶一下:

所以接下來了解一下這個概念。
- 在OopMap的協助下,HotSpot可以快速且准確地完成GC Roots枚舉,但一個很現實的問題隨之而來:可能導致引用關系變化,或者說OopMap內容變化的指令非常多,如果為每一條指令都生成對應的OopMap,那將會需要大量的額外空間,這樣GC的空間成本將會變得更高。
- 實際上,HotSpot並沒有為每條指令都生成OopMap,而只是在“特定的位置”記錄了這些信息,這些位置稱為安全點(Safepoint) ,既程序執行時並非在所有地方都能停頓下來開始GC,只有在達到安全點時才能暫停。這里解釋一下:當JVM遇到空間不夠的時候會執行垃圾回收,但並不是在系統的任何時刻都可以執行垃圾回收,必須要等到程序執行到一個稱之為安全點這樣的一個位置上才可以進行GC。
- Safepoint的選定既不可能太少以至於讓GC等待時間太長,也不能過於頻繁以至於過分增大運行時的負載。所以,安全點的選定基本上是以“是否具有讓程序長時間執行的特征”為標准進行選定的----因為每條指令執行的時間非常短暫,程序不太可能因為指令流長度太長這個原因而過長時間執行,“長時間執行”的最明顯特征就是指令序列復用,例如方法調用、循環跳轉、異常跳轉等,所以具有這些功能的指令才會產生Safepoint。
- 對於Safepoint,另一個需要考慮的問題是如何在GC發生時讓所有線程(這里不包括執行JNI調用的線程)都“跑”到最近的安全點上再停頓下來:搶占式中斷(Preemptive Suspension)和主動式中斷(Voluntary Suspension)。
- 搶占式中斷:它不需要線程的執行代碼主動去配合,在GC發生時,首先把所有線程全部中斷,如果有線程中斷的地方不在安全點上,就恢復線程,讓它“跑”到安全點上。
- 主動式中斷:當GC需要中斷線程的時候,不直接對線程操作,僅僅簡單地設置一個標志,各個線程執行時主動去輪循這個標志,發現中斷標志為真時就自己中斷掛起。輪循標志的地方和安全點是重合的【這個很關鍵,這樣通過標志來中斷剛好是在安全點上發生的】,另外再加上創建對象需要分配內存的地方。注意:現在幾乎沒有虛擬機采用搶占式中斷來暫停線程從而響應GC事件。
安全區域:
- 在使用Safepoint似乎已經完美地解決了如何進入GC的問題,但實際上情況卻並不一定。Safepoint機制保證了程序執行時,在不太長的時間內就會遇到可進入GC的Safepoint。但如果程序在“不執行”的時候呢?所謂程序不執行就是沒有分配CPU時間,典型的例子就是處於Sleep狀態或者Blocked狀態,這時候線程無法響應JVM的中斷請求,JVM也顯示不太可能等待線程重新分配CPU時間。對於這種情況,就需要安全區域(SafeRegin)來解決了。
- 在線程執行到Safe Region中的代碼時,首先標識自己已經進入了Safe Region,那樣,當在這段時間里JVM要發起GC時,就不用管標識自己為Safe Region狀態的線程了,在線程要離開Safe Region時,它要檢查系統是否已經完成了根節點枚舉(或者是整個GC過程),如果完成了,那線程就繼續執行,否則它就必須等待直到收到可以安全離開Safe Region的信號為止。
以上的理論確實是有點頭大,木關系,之后慢慢會通過實踐再來理解的~~
