作為最基礎的引用數據類型,Java 設計者為 String 提供了字符串常量池以提高其性能,那么字符串常量池的具體原理是什么?
-
字符串常量池的設計思想是什么?
-
字符串常量池在哪里?
-
如何操作字符串常量池?
字符串常量池的設計思想
-
字符串的分配,和其他的對象分配一樣,耗費高昂的時間與空間代價,作為最基礎的數據類型,大量頻繁的創建字符串,極大程度地影響程序的性能
-
JVM為了提高性能和減少內存開銷,在實例化字符串常量的時候進行了一些優化
-
為字符串開辟一個字符串常量池,類似於緩存區
-
創建字符串常量時,首先堅持字符串常量池是否存在該字符串,存在該字符串,返回引用實例,不存在,實例化該字符串並放入池中
-
實現的基礎
-
實現該優化的基礎是因為字符串是不可變的,可以不用擔心數據沖突進行共享
-
運行時實例創建的全局字符串常量池中有一個表,總是為池中每個唯一的字符串對象維護一個引用,這就意味着它們一直引用着字符串常量池中的對象,所以,在常量池中的這些字符串不會被垃圾收集器回收
代碼:從字符串常量池中獲取相應的字符串
String str1 = “hello”; String str2 = “hello”; System.out.printl("str1 == str2" : str1 == str2 ) //true
字符串常量池在哪里
在分析字符串常量池的位置時,首先了解一下堆、棧、方法區:
堆
存儲的是對象,每個對象都包含一個與之對應的class
JVM只有一個堆區(heap)被所有線程共享,堆中不存放基本類型和對象引用,只存放對象本身
對象的由垃圾回收器負責回收,因此大小和生命周期不需要確定
棧
每個線程包含一個棧區,棧中只保存基礎數據類型的對象和自定義對象的引用(不是對象)
每個棧中的數據(原始類型和對象引用)都是私有的
棧分為3個部分:基本類型變量區、執行環境上下文、操作指令區(存放操作指令)
數據大小和生命周期是可以確定的,當沒有引用指向數據時,這個數據就會自動消失
方法區
靜態區,跟堆一樣,被所有的線程共享
方法區中包含的都是在整個程序中永遠唯一的元素,如class,static變量
字符串常量池則存在於方法區
代碼:堆棧方法區存儲字符串
String str1 = “abc”; String str2 = “abc”; String str3 = “abc”; String str4 = new String(“abc”); String str5 = new String(“abc”);
字符串對象的創建
面試題:String str4 = new String(“abc”) 創建多少個對象?
-
在常量池中查找是否有“abc”對象
-
有則返回對應的引用實例
-
沒有則創建對應的實例對象
-
在堆中 new 一個 String("abc") 對象
-
將對象地址賦值給str4,創建一個引用
所以,常量池中沒有“abc”字面量則創建兩個對象,否則創建一個對象,以及創建一個引用
根據字面量,往往會提出這樣的變式題:
String str1 = new String("A"+"B") ; 會創建多少個對象?
String str2 = new String("ABC") + "ABC" ; 會創建多少個對象?
str1:
字符串常量池:"A","B","AB" : 3個
堆:new String("AB") :1個
引用:str1 :1個
總共 :5個
str2 :
字符串常量池:"ABC" : 1個
堆:new String("ABC") :1個
引用:str2 :1個
總共 :3個
代碼:基礎類型的變量和常量,變量和引用存儲在棧中,常量存儲在常量池中
int a1 = 1;
int a2 = 1;
int a3 = 1;
public static int INT1 =1 ;
public static int INT2 =1 ;
public static int INT3 =1 ;
操作字符串常量池的方式
-
JVM實例化字符串常量池時
String str1 = “hello”; String str2 = “hello”; System.out.printl("str1 == str2" : str1 == str2 ) //true
-
String.intern()
- 當調用 intern() 方法時,編譯器會將字符串添加到常量池中(stringTable維護),並返回指向該常量的引用。
// Create three strings in three different ways. String s1 = "Hello"; String s2 = new StringBuffer("He").append("llo").toString(); String s3 = s2.intern(); // Determine which strings are equivalent using the == // operator System.out.println("s1 == s2? " + (s1 == s2)); // false System.out.println("s1 == s3? " + (s1 == s3)); // true
字面量可以理解為實際值,int a = 8中的8和String a = "hello"中的hello都是字面量
符號引用就是一個字符串,只要我們在代碼中引用了一個非字面量的東西,不管它是變量還是常量,它都只是由一個字符串定義的符號,這個字符串存在常量池里,類加載的時候第一次加載到這個符號時,就會將這個符號引用(字符串)解析成直接引用(指針)
補充:字面量和常量池初探
字符串對象內部是用字符數組存儲的,那么看下面的例子:
String m = "hello,world";
String n = "hello,world";
String u = new String(m);
String v = new String("hello,world");
-
會分配一個11長度的char數組,並在常量池分配一個由這個char數組組成的字符串,然后由m去引用這個字符串
-
用n去引用常量池里邊的字符串,所以和m引用的是同一個對象
-
生成一個新的字符串,但內部的字符數組引用着m內部的字符數組
-
同樣會生成一個新的字符串,但內部的字符數組引用常量池里邊的字符串內部的字符數組,意思是和u是同樣的字符數組
使用圖來表示的話,情況就大概是這樣的(使用虛線只是表示兩者其實沒什么特別的關系):
測試demo:
String m = "hello,world"; String n = "hello,world"; String u = new String(m); String v = new String("hello,world"); System.out.println(m == n); //true System.out.println(m == u); //false System.out.println(m == v); //false System.out.println(u == v); //false
結論:
-
m和n是同一個對象
-
m,u,v都是不同的對象
-
m,n,u,v但都使用了同樣的字符數組,並且用equal判斷的話也會返回true