1.概述
對於Java程序員來說,在虛擬機自動內存管理機制的幫助下,不再需要手動釋放內存,不容易出現內存泄露和內存溢出問題。一旦出現內存泄露和溢出方面的問題,如果不了解虛擬機是怎樣使用內存的,排查錯誤將會異常艱難。
2. 運行時數據區域
Java虛擬機在執行Java程序的過程中會把它所管理的內存划分為若干個不同的數據區域。這些區域都有各自的用途,以及創建和銷毀的時間,有的區域隨着虛擬機進程的啟動而存在,有些區域則依賴用戶線程的啟動和結束而建立和銷毀。Java虛擬機hotspot所管理的內存包括以下幾個運行時數據區域,如圖所示:
2.1 程序計數器
程序計數器(Program Counter Register)是一塊較小的內存空間,它可以看作是當前線程所執行的Java字節碼的行號指示器。在虛擬機的概念模型里,字節碼解釋器工作時就是通過改變這個計數器的值來選取下一條需要執行的字節碼指令,分支、循環、跳轉、異常處理、線程恢復等基礎功能都需要依賴這個計數器來完成。
由於Java虛擬機的多線程是通過線程輪流切換並分配處理器執行時間的方式來實現的,在任何一個確定的時刻,一個處理器都只會執行一條線程中的指令。因此,為了線程切換后能恢復到正確的執行位置,每條線程都需要有一個獨立的程序計數器,各條線程之間計數器互不影響,獨立存儲,我們稱這類內存區域為“線程私有”的內存。
如果線程正在執行的是一個Java方法,這個計數器記錄的是正在執行的虛擬機字節碼指令的地址;如果正在執行的是Native方法,這個計數器值則為空(Undefined)。此內存區域是唯一 一個在Java虛擬機規范中沒有規定OutOfMemoryError情況的區域。
2.2 Java虛擬機棧
與程序計數器一樣,Java虛擬機棧(Java Virtual Machine Stacks)也是線程私有的,它的生命周期與線程相同。虛擬機棧描述的是Java方法執行的內存模型:每個方法在執行的同時都會創建一個棧幀(Stack Frame)用於存儲局部變量表、操作數棧、動態鏈接、方法出口等信息。每一個方法從調用直至執行完成的過程,就對應着一個棧幀在虛擬機棧中入棧到出棧的過程。
經常有人把Java內存區分為堆內存(Heap)和棧內存(Stack),其中所指的“堆”就是Java堆,而所指的“棧”就是現在所講的虛擬機棧,或者說是虛擬機棧中局部變量表部分。
局部變量表存放了編譯期可知的各種基本數據類型(boolean、byte、char、short、int、float、long、double)、對象引用(reference類型,它不等同於對象本身,可能是一個指向對象起始地址的引用指針,也可能是指向一個代表對象的句柄或其他與此對象相關位置)和returnAddress類型(指向了一條字節碼指令的地址)。
其中64為長度的long和double類型的數據會占用2個局部變量空間(Slot),其余的數據類型只占用1個。局部變量表所需的內存空間在編譯期間完成分配,當進入一個方法時,這個方法需要在幀中分配多大的局部變量空間是完全確定的,在方法運行期間不會改變局部變量表的大小。
在Java虛擬機規范中,對這個區域規定了兩種異常狀況:如果線程請求的棧深度大於虛擬機所允許的深度,將拋出StackOverflowError異常;如果虛擬機棧可以動態擴展(當前大部分的Java虛擬機都可動態擴展,只不過Java虛擬機規范中也允許固定長度的虛擬機棧),如果擴展時無法申請到足夠的內存,就會拋出OutOfMemoryError異常。
2.3 本地方法棧
本地方法棧(Native Method Stack)與虛擬機棧所發揮的作用是非常相似的,它們之間的區別不過是虛擬機棧為虛擬機執行Java方法(也就是字節碼)服務,而本地方法棧則為虛擬機使用到的Native方法服務。在虛擬機規范中對本地方法棧中方法使用的語言、使用方式與數據結構並沒有強制規定。HotSpot虛擬機直接把本地方法棧和虛擬機棧合二為一。與虛擬機棧一樣,本地方法棧區域也會拋出StackOverflowError和OutOfMemoryError異常。
參數設置:
- -Xss 設置每個線程的棧大小。JDK1.5+ 每個線程棧大小為1M,一般來說如果棧不是很深的話,1M是絕對夠用的啦。
參數含義解析:
- 以-X開頭的參數是和實現有關的,第一個s表示stack,第二個s表示size;
注意:
在相同物理內存下,減小這個值能生成更多的線程。但是操作系統對一個進程內的線程數還是有限制的,不能無限生成,經驗值在3000~5000左右。
2.4 Java堆
對於大多數應用來說,Java堆(Java Heap)是Java虛擬機所管理的內存中最大的一塊。Java堆是被所有線程共享的一塊內存區域,在虛擬機啟動時創建。此內存區域的唯一目的就是存放對象實例,幾乎所有的對象實例都在這里分配內存。這一點在Java虛擬機規范中的描述是:所有的對象實例以及數組都要在堆上分配,但是隨着JIT編譯器的發展以及逃逸分析技術逐漸成熟,棧上分配、標量替換優化技術將會導致一些微妙的變化發生,所有的對象都分配在堆上也漸漸變得不是那么“絕對”了。
Java堆是垃圾收集器管理的主要區域,因此很多時候也被稱做“GC堆”(Garbage Collected Heap)。從內存回收的角度來看,由於現在收集器基本都采用分代收集算法,所以Java堆中還可以細分為:新生代和老年代;再細致一點的,新生代可以有Eden空間、From Survivor空間、To Survivor空間等。從內存分配的角度來看,線程共享的Java堆中可能划分出多個線程私有的分配緩沖區(Thread Local Allocation Buffer,TLAB)。不過無論如何划分,都與存放內容無關,無論哪個區域,存儲的都仍然是對象實例,進一步划分的目的是為了更好地回收內存,或者更快地分配內存。
根據Java虛擬機規范的規定,Java堆可以處於物理上不連續的內存空間中,只要邏輯上是連續的即可,就像我們的磁盤空間一樣。在實現時,既可以實現成固定大小的,也可以是擴展的,不過當前主流的虛擬機都是按照可擴展來實現的(通過-Xmx和-Xms控制)。如果在堆中沒有內存完成實例分配,並且堆也無法再擴展時,將會拋出OutOfMemoryError異常。
參數設置:
- -Xms 設置堆的最小空間大小;通常為操作系統可用內存的1/64大小即可。
- -Xmx 設置堆的最大空間大小;通常為操作系統可用內存的1/4大小。
- -Xmn 設置新生代大小,是對-XX:newSize、-XX:MaxnewSize兩個參數的同時配置,這個參數是在JDK1.4版本以后出現的;通常為Xmx的1/3或1/4。新生代 = Eden + 2個Survivor空間。實際可用空間 = Eden + 1個Survivor,即90%。
- -XX:NewSize 設置新生代最小空間大小;
- -XX:MaxNewSize 設置新生代最大空間大小;
- -XX:NewRatio 新生代與老年代的比例,如-XX:NewRatio=2,則新生代占整個堆空間的1/3,老年代占2/3。
- -XX:SurvivorRatio 新生代中 Eden 與 Survivor的比值。默認值為 8 。即Eden占新生代空間的8/10,另外兩個Survivor各占1/10。
參數含義解析:
- 以-X開頭的參數是和實現有關的,並不是適用於所有的參數;
- 最開始只有 -Xms的參數,表示‘初始’ memory size,m表示memory,s表示size;
- 緊接是參數 -Xmx,為了對齊三字符,壓縮了其表示形式,采用計算機中約定表示方式:用 x 表示“”大“ (可以聯想到衣服的號碼大小,S、M、L、XL、XXL),因此 -Xmx中的m應當還是memory。既然有了最大內存的概念,那么一開始的 -Xms所表示的”初始“內存也就有了一個”最小“內存的概念(其實常用的做法中初始內存采用的也就是最小內存)。如果不對齊參數長度的話,其表示應當是-Xmsx。
注意:
開發過程中,通常會將-Xms與-Xmx兩個參數的配置相同的值,其目的是為了能夠在Java垃圾回收機制清理完堆區后不需要重新分隔計算堆區的大小而浪費資源。
2.5 方法區(永久代)
方法區(Method Area)與Java堆一樣,是各個線程共享的內存區域,它用於存儲已被虛擬機加載的類信息、常量、靜態變量、即時編譯器編譯后的代碼等數據,即存放靜態文件,如Java類、方法等。雖然Java虛擬機規范把方法區描述為堆的一個邏輯部分,但是它卻有一個別名叫做Non-Heap(非堆),目的應該是與Java堆區分開來。
對於習慣在HotSpot虛擬機上開發、部署程序的開發者來說,很多人都更願意把方法區稱為“永久代”(Permanent Generation),本質上兩者並不等價,僅僅是因為HotSpot虛擬機的設計團隊選擇把GC分代收集擴展至方法區,或者說使用永久代來實現方法區而已,這樣HotSpot的垃圾收集器可以像管理Java堆一樣管理這部分內存、能夠省去專門為方法區編寫內存管理代碼的工作。
根據Java虛擬機規范的規定,當方法區無法滿足內存分配需求時,將拋出OutOfMemoryError異常。
方法區在不同虛擬機中有不同的實現,HotSpot在1.7版本以前和1.7版本,1.7版本后都有變化。
① jdk7版本以前的實現如下圖所示:
② 在目前已經發布的JDK1.7的HotSpot中,已經把原本放在永久代的字符串常量池移到了Java堆中。
③ jdk8版本中則把永久代給完全刪除了,取而代之的是MetaSpace,如圖:
運行時常量池和靜態變量都存儲到了堆中,MetaSpace存儲類的元數據,MetaSpace直接在本地內存中(Native memory),這樣類的元數據分配只受本地內存大小的限制,OOM問題就不存在了。
參數設置:
- -XX:PermSize設置永久代最小空間大小;
- -XX:MaxPermSize設置永久代最大空間大小;
參數含義解析:
- PermSize,表示永久代初始設置大小,這里初始大小表示最小大小,Perm是permanent永久的意思;
注意:
- JDK8沒有這個參數設置。
- 非堆內存不會被Java垃圾回收機制進行處理,在配置之前一定要慎重考慮下自身軟件所需要的非堆區內存大小。
2.5.1 運行時常量池
運行時常量池(Runtime Constant Pool)是方法區的一部分。Class文件中除了有類的版本、字段、方法、接口等描述信息外,還有一項信息是常量池(Constant Pool Table),用於存放編譯期生成的各種字面量和符號引用,這部分內容將在類加載后進入方法區的運行時常量池中存放。
Java虛擬機對Class文件每一部分(自然也包括常量池)的格式都有嚴格規定,每一個字節用於存儲哪種數據都必須符合規范上的要求才會被虛擬機認可、裝載和執行,但對於運行時常量池,Java虛擬機規范沒有做任何細節的要求。不過,一般來說,除了保存Class文件中描述的符號引用外,還會把翻譯出來的直接引用也存儲在運行時常量池中。
運行時常量池相對於Class文件常量池的另外一個重要特征是具備動態性,Java語言並不要求常量一定只有編譯期才能產生,也就是並非預置入Class文件中常量池的內容才能進入方法區運行時常量池,運行期間也可能將新的常量放入池中,這種特性被開發人員利用得比較多的便是String類的intern()方法。
既然運行時常量池是方法區的一部分,自然受到方法區內存的限制,當常量池無法再申請到內存時會拋出OutOfMemoryError異常。
2.6 直接內存(堆外內存)
直接內存(Direct Memory),也叫堆外內存,它並不是虛擬機運行時數據區的一部分,也不是Java虛擬機規范中定義的內存區域,而是Java虛擬機的堆以外的內存,直接受操作系統管理。但是這部分內存也被頻繁地使用,而且也可能導致OutOfMemoryError異常出現。使用堆外內存有兩個優勢,一是減少了垃圾回收,二是提升復制速度,如NIO就是采用堆外內存。可以使用未公開的Unsafe和NIO包下ByteBuffer來創建堆外內存。
在JDK1.4中新加入了NIO(New Input/Output)類,引入了一種基於通道(Channel)與緩沖區(Buffer)的I/O方式,它可以使用Native函數庫直接分配堆外內存,然后通過一個存儲在Java堆中的DirectByteBuffer對象作為這塊內存的引用進行操作。這樣能在一些場景中顯著提高性能,因為避免了在Java堆和Native堆中來回復制數據。
顯然,本機直接內存的分配不會受到Java堆大小的限制,但是,既然是內存,肯定還是會受到本機總內存(包括RAM以及SWAP區或者分頁文件)大小以及處理尋址空間的限制。服務器管理員在配置虛擬機參數時,會根據實際內存設置-Xmx等參數信息,但經常忽略直接內存,使得各個內存區域總和大於物理內存限制(包括物理的和操作系統級的限制),從而導致動態擴展時出現OutOfMemoryError異常。
參數設置:可以通過 -XX:MaxDirectMemorySize參數來設置最大可用直接內存,如果Java虛擬機啟動時未設置則默認為最大堆內存大小,即與 -Xmx相同。即假如最大堆內存為1G,則默認直接內存也為1G,那么JVM最大需要的內存大小為2G多一些。當直接內存達到最大限制時就會觸發GC,如果回收失敗則會引起OutOfMemoryError。
總結
參考資料:
《深入理解Java虛擬機 JVM高級特性與最佳實踐》第二版
https://blog.csdn.net/u010739551/article/details/80619073