轉(https://blog.51cto.com/13906751/2153924)
前段時間,給星球的球友們專門碼了一篇文章《深入分析Java的編譯原理》,其中深入的介紹了Java中的javac編譯和JIT編譯的區別及原理。並在文中提到:JIT編譯除了具有緩存的功能外,還會對代碼做各種優化,比如:逃逸分析、 鎖消除、 鎖膨脹、 方法內聯、 空值檢查消除、 類型檢測消除、 公共子表達式消除等。
有球友閱讀完這部分內容后,對JVM產生了濃厚的興趣,自己回去專門學習了一下,在學習過程中遇到一個小問題,關於Java內存分配的。所以和我在微信上做過簡單的交流。主要涉及到Java中的堆和棧、數組內存分配、逃逸分析、編譯優化等技術及原理。本文也是關於這部分知識點的分享。
JVM內存分配策略
關於JVM的內存結構及內存分配方式,不是本文的重點,這里只做簡單回顧。以下是我們知道的一些常識:
1、根據Java虛擬機規范,Java虛擬機所管理的內存包括方法區、虛擬機棧、本地方法棧、堆、程序計數器等。
2、我們通常認為JVM中運行時數據存儲包括堆和棧。這里所提到的棧其實指的是虛擬機棧,或者說是虛擬棧中的局部變量表。
3、棧中存放一些基本類型的變量數據(int/short/long/byte/float/double/Boolean/char)和對象引用。
4、堆中主要存放對象,即通過new關鍵字創建的對象。
5、數組引用變量是存放在棧內存中,數組元素是存放在堆內存中。
在《深入理解Java虛擬機中》關於Java堆內存有這樣一段描述:
但是,隨着JIT編譯期的發展與逃逸分析技術逐漸成熟,棧上分配、標量替換優化技術將會導致一些微妙的變化,所有的對象都分配到堆上也漸漸變得不那么“絕對”了。
這里只是簡單提了一句,並沒有深入分析,很多人看到這里由於對JIT、逃逸分析等技術不了解,所以也無法真正理解上面這段話的含義。
PS:這里默認大家都了解什么是JIT,不了解的朋友可以先自行Google了解下,或者加入我的知識星球,閱讀那篇球友專享文章。
其實,在編譯期間,JIT會對代碼做很多優化。其中有一部分優化的目的就是減少內存堆分配壓力,其中一種重要的技術叫做逃逸分析。
逃逸分析
逃逸分析(Escape Analysis)是目前Java虛擬機中比較前沿的優化技術。這是一種可以有效減少Java 程序中同步負載和內存堆分配壓力的跨函數全局數據流分析算法。通過逃逸分析,Java Hotspot編譯器能夠分析出一個新的對象的引用的使用范圍從而決定是否要將這個對象分配到堆上。
逃逸分析的基本行為就是分析對象動態作用域:當一個對象在方法中被定義后,它可能被外部方法所引用,例如作為調用參數傳遞到其他地方中,稱為方法逃逸。
例如:
StringBuffer sb是一個方法內部變量,上述代碼中直接將sb返回,這樣這個StringBuffer有可能被其他方法所改變,這樣它的作用域就不只是在方法內部,雖然它是一個局部變量,稱其逃逸到了方法外部。甚至還有可能被外部線程訪問到,譬如賦值給類變量或可以在其他線程中訪問的實例變量,稱為線程逃逸。
上述代碼如果想要StringBuffer sb不逃出方法,可以這樣寫:
不直接返回 StringBuffer,那么StringBuffer將不會逃逸出方法。
使用逃逸分析,編譯器可以對代碼做如下優化:
一、同步省略。如果一個對象被發現只能從一個線程被訪問到,那么對於這個對象的操作可以不考慮同步。
二、將堆分配轉化為棧分配。如果一個對象在子程序中被分配,要使指向該對象的指針永遠不會逃逸,對象可能是棧分配的候選,而不是堆分配。
三、分離對象或標量替換。有的對象可能不需要作為一個連續的內存結構存在也可以被訪問到,那么對象的部分(或全部)可以不存儲在內存,而是存儲在CPU寄存器中。
上面的關於同步省略的內容,我在《深入理解多線程(五)—— Java虛擬機的鎖優化技術》中有介紹過,即鎖優化中的鎖消除技術,依賴的也是逃逸分析技術。
本文,主要來介紹逃逸分析的第二個用途:將堆分配轉化為棧分配。
其實,以上三種優化中,棧上內存分配其實是依靠標量替換來實現的。由於不是本文重點,這里就不展開介紹了。如果大家感興趣,我后面專門出一篇文章,全面介紹下逃逸分析。
在Java代碼運行時,通過JVM參數可指定是否開啟逃逸分析, -XX:+DoEscapeAnalysis
: 表示開啟逃逸分析 -XX:-DoEscapeAnalysis
: 表示關閉逃逸分析 從jdk 1.7開始已經默認開始逃逸分析,如需關閉,需要指定-XX:-DoEscapeAnalysis
對象的棧上內存分配
我們知道,在一般情況下,對象和數組元素的內存分配是在堆內存上進行的。但是隨着JIT編譯器的日漸成熟,很多優化使這種分配策略並不絕對。JIT編譯器就可以在編譯期間根據逃逸分析的結果,來決定是否可以將對象的內存分配從堆轉化為棧。
我們來看以下代碼:
其實代碼內容很簡單,就是使用for循環,在代碼中創建100萬個User對象。
我們在alloc方法中定義了User對象,但是並沒有在方法外部引用他。也就是說,這個對象並不會逃逸到alloc外部。經過JIT的逃逸分析之后,就可以對其內存分配進行優化。
我們指定以下JVM參數並運行:
-Xmx4G -Xms4G -XX:-DoEscapeAnalysis -XX:+PrintGCDetails -XX:+HeapDumpOnOutOfMemoryError
在程序打印出 cost XX ms
后,代碼運行結束之前,我們使用[jmap][1]
命令,來查看下當前堆內存中有多少個User對象:
➜ ~ jps 2809 StackAllocTest 2810 Jps ➜ ~ jmap -histo 2809 num #instances #bytes class name ---------------------------------------------- 1: 524 87282184 [I 2: 1000000 16000000 StackAllocTest$User 3: 6806 2093136 [B 4: 8006 1320872 [C 5: 4188 100512 java.lang.String 6: 581 66304 java.lang.Class
從上面的jmap執行結果中我們可以看到,堆中共創建了100萬個StackAllocTest$User
實例。
在關閉逃避分析的情況下(-XX:-DoEscapeAnalysis),雖然在alloc方法中創建的User對象並沒有逃逸到方法外部,但是還是被分配在堆內存中。也就說,如果沒有JIT編譯器優化,沒有逃逸分析技術,正常情況下就應該是這樣的。即所有對象都分配到堆內存中。
接下來,我們開啟逃逸分析,再來執行下以上代碼。
-Xmx4G -Xms4G -XX:+DoEscapeAnalysis -XX:+PrintGCDetails -XX:+HeapDumpOnOutOfMemoryError
在程序打印出 cost XX ms
后,代碼運行結束之前,我們使用jmap
命令,來查看下當前堆內存中有多少個User對象:
➜ ~ jps
709
2858 Launcher
2859 StackAllocTest
2860 Jps ➜ ~ jmap -histo 2859 num #instances #bytes class name ----------------------------------------------
1: 524 101944280 [I
2: 6806 2093136 [B
3: 83619 1337904 StackAllocTest$User
4: 8006 1320872 [C
5: 4188 100512 java.lang.String
6: 581 66304 java.lang.Class
從以上打印結果中可以發現,開啟了逃逸分析之后(-XX:+DoEscapeAnalysis),在堆內存中只有8萬多個StackAllocTest$User
對象。也就是說在經過JIT優化之后,堆內存中分配的對象數量,從100萬降到了8萬。
除了以上通過jmap驗證對象個數的方法以外,讀者還可以嘗試將堆內存調小,然后執行以上代碼,根據GC的次數來分析,也能發現,開啟了逃逸分析之后,在運行期間,GC次數會明顯減少。正是因為很多堆上分配被優化成了棧上分配,所以GC次數有了明顯的減少。
總結
所以,如果以后再有人問你:是不是所有的對象和數組都會在堆內存分配空間?
那么你可以告訴他:不一定,隨着JIT編譯器的發展,在編譯期間,如果JIT經過逃逸分析,發現有些對象沒有逃逸出方法,那么有可能堆內存分配會被優化成棧內存分配。但是這也並不是絕對的。就像我們前面看到的一樣,在開啟逃逸分析之后,也並不是所有User對象都沒有在堆上分配。