JAVA對象的創建及內存分配詳解


Java對象的創建

幾乎所以對象都在JVM的堆中創建,通過類加載器加載進內存,並檢查,然后分配內存,開始類的屬性初始化賦值設置對象頭信息,通過構造方法創建對象

一個簡單的創建對象語句Clazz instance = new Clazz();包含的主要過程包括了類加載檢查、對象分配內存、並發處理、內存空間初始化、對象設置、執行ini方法等。

主要流程如下:

 

檢查加載

當虛擬機遇到一條new指令的時候,首先檢查這個指令的參數是否能在常量池中定位到一個類的符號引用,並且檢查這個符號引用代表的類是否已被加載、解析和初始化過如果沒有,那必須先執行相應的類的加載過程

分配內存

在類加載檢查通過后,那就要為實例化的對象分配內存。對象所需內存的大小在類加載完成后便完全確定(對象內存布局),為對象分配空間的任務等同於把一塊確定大小的內存從Java堆中划分出來

根據Java堆中是否規整有兩種內存的分配方式:(Java堆是否規整由所采用的垃圾收集器是否帶有壓縮整理功能決定

  • 指針碰撞(Bump the pointer) 
    Java堆中的內存是規整的,所有用過的內存都放在一邊,空閑的內存放在另一邊,中間放着一個指針作為分界點的指示器,分配內存也就是把指針向空閑空間那邊移動一段與內存大小相等的距離。例如:Serial、ParNew等收集器沒有產生內存碎片,所以采用的是"指針碰撞"。
  • 空閑列表(Free List)
    Java堆中的內存不是規整的,已使用的內存和空閑的內存相互交錯,就沒有辦法簡單的進行指針碰撞了。虛擬機必須維護一張列表,記錄哪些內存塊是可用的,在分配的時候從列表中找到一塊足夠大的空間划分給對象實例,並更新列表上的記錄。例如:CMS這種基於"標記-清除"的收集器,會產生內存碎片,空閑內存跟已經分配的內存相互交錯,所以采用的是"空閑列表"。

並發處理

對象創建在虛擬機中是非常頻繁的行為,即使是僅僅修改一個指針指向的位置,在並發情況下也並不是線程安全的,可能出現正在給對象A分配內存,指針還沒來得及修改,對象B又同時使用了原來的指針來分配內存的情況。解決這個問題有兩種方案:

  • 虛擬機采用CAS加上失敗重試的方式保證更新操作的原子性
  • 本地線程分配緩沖(Thread Local Allocation Buffer, TLAB) :把內存分配的動作按照線程划分為在不同的空間之中進行,即每個線程在Java堆中預先分配一小塊內存(TLAB)。哪個線程要分配內存,就在哪個線程的TLAB上分配。只有TLAB用完並分配新的TLAB時,才需要同步鎖定。可用JVM參數-XX:+/-UseTLAB參數設定。

內存空間初始化

虛擬機將分配到的內存空間都初始化為零值(不包括對象頭), 如果使用了TLAB,這一工作過程也可以提前至TLAB分配時進行。

內存空間初始化保證了對象的實例字段在Java代碼中可以不賦初始值就直接使用,程序能訪問到這些字段的數據類型所對應的零值。

注意:類的成員變量可以不顯示地初始化(Java虛擬機都會先自動給它初始化為默認值)。方法中的局部變量如果只負責接收一個表達式的值,可以不初始化,但是參與運算和直接輸出等其它情況的局部變量需要初始化。

對象設置

虛擬機對對象進行必要的設置,例如這個對象是哪個類的實例、如何才能找到類的元數據信息、對象的哈希碼、對象的GC分代年齡等信息。這些信息存放在對象的對象頭之中。

執行init()

在上面的工作都完成之后,從虛擬機的角度看,一個新的對象已經產生了。但是從Java程序的角度看,對象的創建才剛剛開始init()方法還沒有執行,所有的字段都還是零。

所以,一般來說(由字節碼中是否跟隨invokespecial指令所決定),執行new指令之后會接着執行init()方法,把對象按照程序員的意願進行初始化,這樣一個真正可用的對象才算產生出來。

對象內存布局

在HotSpot虛擬機中,對象在內存中存儲的布局可以分為3塊區域:對象頭(Header)、實例數據(Instance Data)和對齊填充(Padding)。 

對象頭

HotSpot虛擬機的對象頭包括兩部分信息:運行時數據和類型指針

運行時數據

用於存儲對象自身的運行時數據,如哈希碼(HashCode)、GC分代年齡、鎖狀態標志、線程持有的鎖、偏向線程ID、偏向時間戳等。這部分我們稱之為"Mard Word",這部分的數據在32bit跟64bit的虛擬機中的大小分別為32bit、64bit,由於需要存儲的運行時數據很多,為了考慮空間效率,"Mard Word"采用非固定的數據接口,根據自己的狀態復用自己的存儲空間

 

類型指針

對象指向它的類元數據的指針,虛擬機通過這個指針來確定這個對象是哪個類的實例

如果對象是一個Java數組,那在對象頭中還必須有一塊用於記錄數組長度的數據,因為虛擬機可以通過普通Java對象的元數據信息確定Java對象的大小,但是從數組的元數據中無法確定數組的大小。
(並不是所有的虛擬機實現都必須在對象數據上保留類型指針,換句話說,查找對象的元數據並不一定要經過對象本身,可參考對象的訪問定位)。

實例數據

實例數據部分是對象真正存儲的有效信息,也是在程序代碼中所定義的各種類型的字段內容。無論是從父類中繼承下來的,還是在子類中定義的,都需要記錄下來。HotSpot虛擬機默認的分配策略為longs/doubles、ints、shorts/chars、bytes/booleans、oop,從分配策略中可以看出,相同寬度的字段總是分配到一起。

對齊填充

HotSpot虛擬機要求對象的起始地址必須是8字節的整數倍,也就是對象的大小必須是8字節的整數倍。而對象頭部分正好是8字節的倍數(1倍或者2倍),因此,當對象實例數據部分沒有對齊的時候,就需要通過對齊填充來補全。

對象訪問定位

Java程序需要通過棧上的引用數據來操作堆上的具體對象。對象的訪問方式取決於虛擬機實現,目前主流的訪問方式有使用句柄和直接指針兩種。

句柄,可以理解為指向指針的指針,維護指向對象的指針變化,而對象的句柄本身不發生變化;指針,指向對象,代表對象的內存地址。

句柄

Java堆中划分出一塊內存來作為句柄池,引用中存儲對象的句柄地址,而句柄中包含了對象實例數據與類型數據各自的具體地址信息。

優勢:引用中存儲的是穩定的句柄地址,在對象被移動(垃圾收集時移動對象是非常普遍的行為)時只會改變句柄中的實例數據指針,而引用本身不需要修改。

直接指針

如果使用直接指針訪問,那么Java堆對象的布局中就必須考慮如何放置訪問類型數據的相關信息,而引用中存儲的直接就是對象地址。

優勢:速度更快,節省了一次指針定位的時間開銷。由於對象的訪問在Java中非常頻繁,因此這類開銷積少成多后也是非常可觀的執行成本。(例如HotSpot)

對象的分配與釋放

程序員通過new為每個對象申請內存空間(基本類型除外),所有對象都在堆中分配空間;對象的釋放是由垃圾回收機制決定和執行的。

分配

Java內存分為兩種:棧內存和堆內存

(1) 在函數中定義的基本類型變量(即基本類型的局部變量)和對象的引用變量(即對象的變量名)都在棧內存中分配;

(2) 堆內存用來存儲由new創建的對象和數組以及對象的實例變量(即全局變量)

(3) 堆的優勢是可以動態分配內存大小,生存期也不必事先告訴編譯器,因為它是運行時動態分配內存的;缺點是運行時動態分配內存,存取速度慢;

(4) 棧的優點是存取速度較快僅僅次於CPU中的寄存器,且棧數據可以共享;但是棧中的數據大小和生存期是必須確定的,缺乏靈活性;

(5) 只有一個堆區被所有線程共享,堆區不存放基本類型和對象引用只存放對象本身;

(6) 每個線程包含一個棧區,保存基礎數據類型的對象和自定義對象的引用,每個棧中的數據(原始類型和對象引用)都是私有的,其他棧不能訪問;

還有一個方法區:存儲所有對象數據共享區域,存儲靜態變量和普通方法、靜態方法、常量、字符串常量等信息,又叫靜態區,是所有線程共享的。

對象銷毀

Java中垃圾收集器自動地定期掃描Java對象的動態內存,並將所有的引用對象加上標記,在對象運行結束后(無引用變量對該對象進行關聯),清除其標記,並將所有無標記的對象作為垃圾進行回收,釋放垃圾對象所占的內存空間。

對象運行結束后或生命周期結束時,將成為垃圾對象,但並不意味着就立即會被回收,僅當垃圾收集器空閑或內存不足時,才會回收他們。

垃圾回收器在回收對象時自動調用對象的finalize()方法來釋放系統資源。

 

參考文檔:

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM