簡介
JVM在運行的時候會對class文件進行加載,鏈接和初始化的過程。class文件中定義的常量池在JVM加載之后會發生什么神奇的變化呢?快來看一看吧。
class文件中的常量池
之前我們在講class文件的結構時,提到了每個class文件都有一個常量池,常量池中存了些什么東西呢?
字符串常量,類和接口名字,字段名,和其他一些在class中引用的常量。
運行時常量池
但是只有class文件中的常量池肯定是不夠的,因為我們需要在JVM中運行起來。
這時候就需要一個運行時常量池,為JVM的運行服務。
運行時常量池和class文件的常量池是一一對應的,它就是class文件的常量池來構建的。
運行時常量池中有兩種類型,分別是symbolic references符號引用和static constants靜態常量。
其中靜態常量不需要后續解析,而符號引用需要進一步進行解析處理。
什么是靜態常量,什么是符號引用呢? 我們舉個直觀的例子。
String site="www.flydean.com"
上面的字符串"www.flydean.com"可以看做是一個靜態常量,因為它是不會變化的,是什么樣的就展示什么樣的。
而上面的字符串的名字“site”就是符號引用,需要在運行期間進行解析,為什么呢?
因為site的值是可以變化的,我們不能在第一時間確定其真正的值,需要在動態運行中進行解析。
靜態常量詳解
運行時常量池中的靜態常量是從class文件中的constant_pool構建的。可以分為兩部分:String常量和數字常量。
String常量
String常量是對String對象的引用,是從class中的CONSTANT_String_info結構體構建的:
CONSTANT_String_info {
u1 tag;
u2 string_index;
}
tag就是結構體的標記,string_index是string在class常量池的index。
string_index對應的class常量池的內容是一個CONSTANT_Utf8_info結構體。
CONSTANT_Utf8_info {
u1 tag;
u2 length;
u1 bytes[length];
}
CONSTANT_Utf8_info是啥呢?它就是要創建的String對象的變種UTF-8編碼。
我們知道unicode的范圍是從0x0000 至 0x10FFFF。
變種UTF-8就是將unicode進行編碼的方式。那是怎么編碼呢?
從上圖可以看到,不同的unicode范圍使用的是不同的編碼方式。
注意,如果一個字符占用多個字節,那么在class文件中使用的是 big-endian 大端優先的排列方式。
如果字符范圍在FFFF之后,那么使用的是2個3字節的格式的組合。
講完class文件中CONSTANT_String_info的結構之后,我們再來看看從CONSTANT_String_info創建運行時String常量的規則:
-
規則一:如果String.intern之前被調用過,並且返回的結果和CONSTANT_String_info中保存的編碼是一致的話,表示他們指向的是同一個String的實例。
-
規則二:如果不同的話,那么會創建一個新的String實例,並將運行時String常量指向該String的實例。最后會在這個String實例上調用String的intern方法。調用intern方法主要是將這個String實例加入字符串常量池。
數字常量
數字常量是從class文件中的CONSTANT_Integer_info, CONSTANT_Float_info, CONSTANT_Long_info和 CONSTANT_Double_info 構建的。
符號引用詳解
符號引用也是從class中的constant_pool中構建的。
對class和interface的符號引用來自於CONSTANT_Class_info。
對class和interface中字段的引用來自於CONSTANT_Fieldref_info。
class中方法的引用來自於CONSTANT_Methodref_info。
interface中方法的引用來自於CONSTANT_InterfaceMethodref_info。
對方法句柄的引用來自於CONSTANT_MethodHandle_info。
對方法類型的引用來自於CONSTANT_MethodType_info。
對動態計算常量的符號引用來自於CONSTANT_MethodType_info。
對動態計算的call site的引用來自於CONSTANT_InvokeDynamic_info。
String Pool字符串常量池
我們在講到運行時常量池的時候,有提到String常量是對String對象的引用。那么這些創建的String對象是放在什么地方呢?
沒錯,就是String Pool字符串常量池。
這個String Pool在每個JVM中都只會維護一份。是所有的類共享的。
String Pool是在1.6之前是存放在方法區的。在1.8之后被放到了java heap中。
注意,String Pool中存放的是字符串的實例,也就是用雙引號引起來的字符串。
那么問題來了?
String name = new String("www.flydean.com");
到底創建了多少個對象呢?
總結
class文件中常量池保存的是字符串常量,類和接口名字,字段名,和其他一些在class中引用的常量。每個class都有一份。
運行時常量池保存的是從class文件常量池構建的靜態常量引用和符號引用。每個class都有一份。
字符串常量池保存的是“字符”的實例,供運行時常量池引用。
運行時常量池是和class或者interface一一對應的,那么如果一個class生成了兩個實例對象,這兩個實例對象是共享一個運行時常量池還是分別生成兩個不同的常量池呢?歡迎小伙伴們留言討論。
本文鏈接:http://www.flydean.com/jvm-run-time-constant-pool/
最通俗的解讀,最深刻的干貨,最簡潔的教程,眾多你不知道的小技巧等你來發現!
歡迎關注我的公眾號:「程序那些事」,懂技術,更懂你!