圖文詳解Java對象內存布局

本文轉載自查看原文 2021-04-03 09:03 574 jvm

作為一名Java程序員，我們在日常工作中使用這款面向對象的編程語言時，做的最頻繁的操作大概就是去創建一個個的對象了。對象的創建方式雖然有很多，可以通過new、反射、clone、反序列化等不同方式來創建，但最終使用時對象都要被放到內存中，那么你知道在內存中的java對象是由哪些部分組成、又是怎么存儲的嗎？

本文將基於代碼進行實例測試，詳細探討對象在內存中的組成結構。全文目錄結構如下：

1、對象內存結構概述
2、JOL 工具簡介
3、對象頭
4、實例數據
5、對齊填充字節
6、總結

文中代碼基於 JDK 1.8.0_261，64-Bit HotSpot 運行

1、對象內存結構概述

在介紹對象在內存中的組成結構前，我們先簡要回顧一個對象的創建過程：

1、jvm將對象所在的class文件加載到方法區中

2、jvm讀取main方法入口，將main方法入棧，執行創建對象代碼

3、在main方法的棧內存中分配對象的引用，在堆中分配內存放入創建的對象，並將棧中的引用指向堆中的對象

所以當對象在實例化完成之后，是被存放在堆內存中的，這里的對象由3部分組成，如下圖所示：

對各個組成部分的功能簡要進行說明：

對象頭：對象頭存儲的是對象在運行時狀態的相關信息、指向該對象所屬類的元數據的指針，如果對象是數組對象那么還會額外存儲對象的數組長度
實例數據：實例數據存儲的是對象的真正有效數據，也就是各個屬性字段的值，如果在擁有父類的情況下，還會包含父類的字段。字段的存儲順序會受到數據類型長度、以及虛擬機的分配策略的影響
對齊填充字節：在java對象中，需要對齊填充字節的原因是，64位的jvm中對象的大小被要求向8字節對齊，因此當對象的長度不足8字節的整數倍時，需要在對象中進行填充操作。注意圖中對齊填充部分使用了虛線，這是因為填充字節並不是固定存在的部分，這點在后面計算對象大小時具體進行說明

2、JOL 工具簡介

在具體開始研究對象的內存結構之前，先介紹一下我們要用到的工具，openjdk官網提供了查看對象內存布局的工具jol (java object layout)，可在maven中引入坐標：

<dependency>
    <groupId>org.openjdk.jol</groupId>
    <artifactId>jol-core</artifactId>
    <version>0.14</version>
</dependency>

在代碼中使用jol提供的方法查看jvm信息：

System.out.println(VM.current().details());

通過打印出來的信息，可以看到我們使用的是64位 jvm，並開啟了指針壓縮，對象默認使用8字節對齊方式。通過jol查看對象內存布局的方法，將在后面的例子中具體展示，下面開始對象內存布局的正式學習。

3、對象頭

首先看一下對象頭（Object header）的組成部分，根據普通對象和數組對象的不同，結構將會有所不同。只有當對象是數組對象才會有數組長度部分，普通對象沒有該部分，如下圖所示：

在對象頭中mark word 占8字節，默認開啟指針壓縮的情況下Klass pointer 占4字節，數組對象的數組長度占4字節。在了解了對象頭的基礎結構后，現在以一個不包含任何屬性的空對象為例，查看一下它的內存布局，創建User類：

public class User {
}

使用jol查看對象頭的內存布局：

public static void main(String[] args) {
    User user=new User();
    //查看對象的內存布局
    System.out.println(ClassLayout.parseInstance(user).toPrintable());
}

執行代碼，查看打印信息：

OFFSET：偏移地址，單位為字節
SIZE：占用內存大小，單位為字節
TYPE：Class中定義的類型
DESCRIPTION：類型描述，Obejct header 表示對象頭，alignment表示對齊填充
VALUE：對應內存中存儲的值

當前對象共占用16字節，因為8字節標記字加4字節的類型指針，不滿足向8字節對齊，因此需要填充4個字節：

8B (mark word) + 4B (klass pointer) + 0B (instance data) + 4B (padding)

這樣我們就通過直觀的方式，了解了一個不包含屬性的最簡單的空對象，在內存中的基本組成是怎樣的。在此基礎上，我們來深入學習對象頭中各個組成部分。

3.1 Mark Word 標記字

在對象頭中，mark word 一共有64個bit，用於存儲對象自身的運行時數據，標記對象處於以下5種狀態中的某一種：

3.1.1 鎖升級

在jdk6 之前，通過synchronized關鍵字加鎖時使用無差別的的重量級鎖，重量級鎖會造成線程的串行執行，並且使CPU在用戶態和核心態之間頻繁切換。隨着對synchronized的不斷優化，提出了鎖升級的概念，並引入了偏向鎖、輕量級鎖、重量級鎖。在mark word中，鎖（lock）標志位占用2個bit，結合1個bit偏向鎖（biased_lock）標志位，這樣通過倒數的3位，就能用來標識當前對象持有的鎖的狀態，並判斷出其余位存儲的是什么信息。

基於mark word的鎖升級的流程如下：

1、鎖對象剛創建時，沒有任何線程競爭，對象處於無鎖狀態。在上面打印的空對象的內存布局中，根據大小端，得到最后8位是00000001，表示處於無鎖態，並且處於不可偏向狀態。這是因為在jdk中偏向鎖存在延遲4秒啟動，也就是說在jvm啟動后4秒后創建的對象才會開啟偏向鎖，我們通過jvm參數取消這個延遲時間：

-XX:BiasedLockingStartupDelay=0

這時最后3位為101，表示當前對象的鎖沒有被持有，並且處於可被偏向狀態。

2、在沒有線程競爭的條件下，第一個獲取鎖的線程通過CAS將自己的threadId寫入到該對象的mark word中，若后續該線程再次獲取鎖，需要比較當前線程threadId和對象mark word中的threadId是否一致，如果一致那么可以直接獲取，並且鎖對象始終保持對該線程的偏向，也就是說偏向鎖不會主動釋放。

使用代碼進行測試同一個線程重復獲取鎖的過程：

public static void main(String[] args) {
    User user=new User();
    synchronized (user){
        System.out.println(ClassLayout.parseInstance(user).toPrintable());
    }
    System.out.println(ClassLayout.parseInstance(user).toPrintable());
    synchronized (user){
        System.out.println(ClassLayout.parseInstance(user).toPrintable());
    }
}

執行結果：

可以看到一個線程對一個對象加鎖、解鎖、重新獲取對象的鎖時，mark word都沒有發生變化，偏向鎖中的當前線程指針始終指向同一個線程。

3、當兩個或以上線程交替獲取鎖，但並沒有在對象上並發的獲取鎖時，偏向鎖升級為輕量級鎖。在此階段，線程采取CAS的自旋方式嘗試獲取鎖，避免阻塞線程造成的cpu在用戶態和內核態間轉換的消耗。測試代碼如下：

public static void main(String[] args) throws InterruptedException {
    User user=new User();
    synchronized (user){
        System.out.println("--MAIN--:"+ClassLayout.parseInstance(user).toPrintable());
    }

    Thread thread = new Thread(() -> {
        synchronized (user) {
            System.out.println("--THREAD--:"+ClassLayout.parseInstance(user).toPrintable());
        }
    });
    thread.start();
    thread.join();
    System.out.println("--END--:"+ClassLayout.parseInstance(user).toPrintable());
}

先直接看一下結果：

整個加鎖狀態的變化流程如下：

主線程首先對user對象加鎖，首次加鎖為101偏向鎖
子線程等待主線程釋放鎖后，對user對象加鎖，這時將偏向鎖升級為00輕量級鎖
輕量級鎖解鎖后，user對象無線程競爭，恢復為001無鎖態，並且處於不可偏向狀態。如果之后有線程再嘗試獲取user對象的鎖，會直接加輕量級鎖，而不是偏向鎖

4、當兩個或以上線程並發的在同一個對象上進行同步時，為了避免無用自旋消耗cpu，輕量級鎖會升級成重量級鎖。這時mark word中的指針指向的是monitor對象（也被稱為管程或監視器鎖）的起始地址。測試代碼如下：

public static void main(String[] args) {
    User user = new User();
    new Thread(() -> {
        synchronized (user) {
            System.out.println("--THREAD1--:" + ClassLayout.parseInstance(user).toPrintable());
            try {
                TimeUnit.SECONDS.sleep(2);
            } catch (InterruptedException e) {
                e.printStackTrace();
            }
        }
    }).start();
    new Thread(() -> {
        synchronized (user) {
            System.out.println("--THREAD2--:" + ClassLayout.parseInstance(user).toPrintable());
            try {
                TimeUnit.SECONDS.sleep(2);
            } catch (InterruptedException e) {
                e.printStackTrace();
            }
        }
    }).start();
}

查看結果：

可以看到，在兩個線程同時競爭user對象的鎖時，會升級為10重量級鎖。

3.1.2 其他信息

對mark word 中其他重要信息進行說明：

hashcode：無鎖態下的hashcode采用了延遲加載技術，在第一次調用hashCode()方法時才會計算寫入。對這一過程進行驗證：

public static void main(String[] args) {
    User user=new User();
    //打印內存布局
    System.out.println(ClassLayout.parseInstance(user).toPrintable());
    //計算hashCode
    System.out.println(user.hashCode());
    //再次打印內存布局
    System.out.println(ClassLayout.parseInstance(user).toPrintable());
}

可以看到，在沒有調用hashCode()方法前，31位的哈希值不存在，全部填充為0。在調用方法后，根據大小端，被填充的數據為：

1011001001101100011010010101101

將2進制轉換為10進制，對應哈希值1496724653。需要注意，只有在調用沒有被重寫的Object.hashCode()方法或System.identityHashCode(Object)方法才會寫入mark word，執行用戶自定義的hashCode()方法不會被寫入。

大家可能會注意到，當對象被加鎖后，mark word中就沒有足夠空間來保存hashCode了，這時hashcode會被移動到重量級鎖的Object Monitor中。

epoch：偏向鎖的時間戳
分代年齡（age）：在jvm的垃圾回收過程中，每當對象經過一次Young GC，年齡都會加1，這里4位來表示分代年齡最大值為15，這也就是為什么對象的年齡超過15后會被移到老年代的原因。在啟動時可以通過添加參數來改變年齡閾值：

-XX:MaxTenuringThreshold

當設置的閾值超過15時，啟動時會報錯：

3.2 Klass Pointer 類型指針

Klass Pointer是一個指向方法區中Class信息的指針，虛擬機通過這個指針確定該對象屬於哪個類的實例。在64位的JVM中，支持指針壓縮功能，根據是否開啟指針壓縮，Klass Pointer占用的大小將會不同：

未開啟指針壓縮時，類型指針占用8B (64bit)
開啟指針壓縮情況下，類型指針占用4B (32bit)

在jdk6之后的版本中，指針壓縮是被默認開啟的，可通過啟動參數開啟或關閉該功能：

#開啟指針壓縮：
-XX:+UseCompressedOops
#關閉指針壓縮：
-XX:-UseCompressedOops

還是以剛才的User類為例，關閉指針壓縮后再次查看對象的內存布局：

對象大小雖然還是16字節，但是組成發生了改變，8字節標記字加8字節類型指針，已經能滿足對齊條件，因此不需要填充。

8B (mark word) + 8B (klass pointer) + 0B (instance data) + 0B (padding)

3.2.1 指針壓縮原理

在了解了指針壓縮的作用后，我們來看一下指針壓縮是如何實現的。首先在不開啟指針壓縮的情況下，一個對象的內存地址使用64位表示，這時能描述的內存地址范圍是：

0 ~ 2^64-1

在開啟指針壓縮后，使用4個字節也就是32位，可以表示2^32 個內存地址，如果這個地址是真實地址的話，由於CPU尋址的最小單位是Byte，那么就是4GB內存。這對於我們來說是遠遠不夠的，但是之前我們說過，java中對象默認使用了8字節對齊，也就是說1個對象占用的空間必須是8字節的整數倍，這樣就創造了一個條件，使jvm在定位一個對象時不需要使用真正的內存地址，而是定位到由java進行了8字節映射后的地址（可以說是一個映射地址的編號）。

完成壓縮后，現在指針的32位中的每一個bit，都可以代表8個字節，這樣就相當於使原有的內存地址得到了8倍的擴容。所以在8字節對齊的情況下，32位最大能表示2^32*8=32GB內存，內存地址范圍是：

0 ~ (2^32-1)*8

由於能夠表示的最大內存是32GB，所以如果配置的最大的堆內存超過這個數值時，那么指針壓縮將會失效。配置jvm啟動參數：

-Xmx32g

查看對象內存布局：

此時，指針壓縮失效，指針長度恢復到8字節。那么如果業務場景內存超過32GB怎么辦呢，可以通過修改默認對齊長度進行再次擴展，我們將對齊長度修改為16字節：

-XX:ObjectAlignmentInBytes=16 -Xmx32g

可以看到指針壓縮后占4字節，同時對象向16字節進行了填充對齊，按照上面的計算，這時配置最大堆內存為64GB時指針壓縮才會失效。

對指針壓縮做一下簡單總結：

通過指針壓縮，利用對齊填充的特性，通過映射方式達到了內存地址擴展的效果
指針壓縮能夠節省內存空間，同時提高了程序的尋址效率
堆內存設置時最好不要超過32GB，這時指針壓縮將會失效，造成空間的浪費
此外，指針壓縮不僅可以作用於對象頭的類型指針，還可以作用於引用類型的字段指針，以及引用類型數組指針

3.3 數組長度

如果當對象是一個數組對象時，那么在對象頭中有一個保存數組長度的空間，占用4字節（32bit）空間。通過下面代碼進行測試：

public static void main(String[] args) {
    User[] user=new User[2];
    //查看對象的內存布局
    System.out.println(ClassLayout.parseInstance(user).toPrintable());
}

運行代碼，結果如下：

內存結構從上到下分別為：

8字節mark word
4字節klass pointer
4字節數組長度，值為2，表示數組中有兩個元素
開啟指針壓縮后每個引用類型占4字節，數組中兩個元素共占8字節

需要注意的是，在未開啟指針壓縮的情況下，在數組長度后會有一段對齊填充字節：

通過計算：

8B (mark word) + 8B (klass pointer) + 4B (array length) + 16B (instance data)=36B

需要向8字節進行對齊，這里選擇將對齊的4字節添加在了數組長度和實例數據之間。

4、實例數據

實例數據（Instance Data）保存的是對象真正存儲的有效信息，保存了代碼中定義的各種數據類型的字段內容，並且如果有繼承關系存在，子類還會包含從父類繼承過來的字段。

基本數據類型：

Type	Bytes
byte，boolean	1
char，short	2
int，float	4
long，double	8

引用數據類型：

開啟指針壓縮情況下占8字節，開啟指針壓縮后占4字節。

4.1 字段重排序

給User類添加基本數據類型的屬性字段：

public class User {
    int id,age,weight;
    byte sex;
    long phone;
    char local;
}

查看內存布局：

可以看到，在內存中，屬性的排列順序與在類中定義的順序不同，這是因為jvm會采用字段重排序技術，對原始類型進行重新排序，以達到內存對齊的目的。具體規則遵循如下：

按照數據類型的長度大小，從大到小排列
具有相同長度的字段，會被分配在相鄰位置
如果一個字段的長度是L個字節，那么這個字段的偏移量（OFFSET）需要對齊至nL（n為整數）

上面的前兩條規則相對容易理解，這里通過舉例對第3條進行解釋：

因為long類型占8字節，所以它的偏移量必定是8n，再加上前面對象頭占12字節，所以long類型變量的最小偏移量是16。通過打印對象內存布局可以發現，當對象頭不是8字節的整數倍時（只存在8n+4字節情況），會按從大到小的順序，使用4、2、1字節長度的屬性進行補位。為了和對齊填充進行區分，可以稱其為前置補位，如果在補位后仍然不滿足8字節整數倍，會進行對齊填充。在存在前置補位的情況下，字段的排序會打破上面的第一條規則。

因此在上面的內存布局中，先使用4字節的int進行前置補位，再按第一條規則從大到小順序進行排列。如果我們刪除3個int類型的字段，再查看內存布局：

char和byte類型的變量被提到前面進行前置補位，並在long類型前進行了1字節的對齊填充。

4.2 擁有父類情況

當一個類擁有父類時，整體遵循在父類中定義的變量出現在子類中定義的變量之前的原則

public class A {
    int i1,i2;
    long l1,l2;
    char c1,c2;
}
public class B extends A{
    boolean b1;
    double d1,d2;
}

查看內存結構：

如果父類需要后置補位的情況，可能會將子類中類型長度較短的變量提前，但是整體還是遵循子類在父類之后的原則

public class A {
    int i1,i2;
    long l1;
}
public class B extends A {
    int i1,i2;
    long l1;
}

查看內存結構：

可以看到，子類中較短長度的變量被提前到父類后進行了后置補位。

父類的前置對齊填充會被子類繼承

public class A {
    long l;
}
public class B extends A{
    long l2;
    int i1;
}

查看內存結構：

當B類沒有繼承A類時，正好滿足8字節對齊，不需要進行對齊填充。當B類繼承A類后，會繼承A類的前置補位填充，因此在B類的末尾也需要對齊填充。

4.3 引用數據類型

在上面的例子中，僅探討了基本數據類型的排序情況，那么如果存在引用數據類型時，排序情況是怎樣的呢？在User類中添加引用類型：

public class User {
     int id;
     String firstName;
     String lastName;
     int age;
}

查看內存布局：

可以看到默認情況下，基本數據類型的變量排在引用數據類型前。這個順序可以在jvm啟動參數中進行修改：

-XX:FieldsAllocationStyle=0

重新運行，可以看到引用數據類型的排列順序被放在了前面：

對FieldsAllocationStyle的不同取值簡要說明：

0：先放入普通對象的引用指針，再放入基本數據類型變量
1：默認情況，表示先放入基本數據類型變量，再放入普通對象的引用指針

4.4 靜態變量

在上面的基礎上，在類中加入靜態變量：

public class User {
     int id;
     static byte local;
}

查看內存布局：

通過結果可以看到，靜態變量並不在對象的內存布局中，它的大小是不計算在對象中的，因為靜態變量屬於類而不是屬於某一個對象的。

5、對齊填充字節

在Hotspot的自動內存管理系統中，要求對象的起始地址必須是8字節的整數倍，也就是說對象的大小必須滿足8字節的整數倍。因此如果實例數據沒有對齊，那么需要進行對齊補全空缺，補全的bit位僅起占位符作用，不具有特殊含義。

在前面的例子中，我們已經對對齊填充有了充分的認識，下面再做一些補充：

在開啟指針壓縮的情況下，如果類中有long/double類型的變量時，會在對象頭和實例數據間形成間隙（gap），為了節省空間，會默認把較短長度的變量放在前邊，這一功能可以通過jvm參數進行開啟或關閉：

# 開啟
-XX:+CompactFields
# 關閉
-XX:-CompactFields

測試關閉情況，可以看到較短長度的變量沒有前移填充：

在前面指針壓縮中，我們提到了可以改變對齊寬度，這也是通過修改下面的jvm參數配置實現的：

-XX:ObjectAlignmentInBytes

默認情況下對齊寬度為8，這個值可以修改為2~256以內2的整數冪，一般情況下都以8字節對齊或16字節對齊。測試修改為16字節對齊：

上面的例子中，在調整為16字節對齊的情況下，最后一行的屬性字段只占了6字節，因此會添加10字節進行對齊填充。當然普通情況下不建議修改對齊長度參數，如果對齊寬度過長，可能會導致內存空間的浪費。

6、總結

本文通過使用jol 對java對象進行測試，學習了對象內存布局的基本知識。通過學習，能夠幫助我們：

掌握對象內存布局，基於此基礎進行jvm參數調優
了解對象頭在synchronize 的鎖升級過程中的作用
熟悉 jvm 中對象的尋址過程
通過計算對象大小，可以在評估業務量的基礎上在項目上線前預估需要使用多少內存，防止服務器頻繁gc

如果文章對您有所幫助，歡迎關注公眾號 碼農參上

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Java對象的內存布局 Java 對象內存布局附 Java對象內存布局 JVM總結-java對象的內存布局圖說C++對象模型：對象內存布局詳解 Java對象創建的過程及對象的內存布局與訪問定位 .NET對象的內存布局理解Java對象：要從內存布局及底層機制說起，話說…. JAVA對象的創建及內存分配詳解 Java虛擬機創建對象的內存分配以及對象的內存布局