Java中,那些關於String和字符串常量池你不得不知道的東西


老套的筆試題

在一些老套的筆試題中,會要你判斷s1==s2為false還是true,s1.equals(s2)為false還是true。

String s1 = new String("xyz");
String s2 = "xyz";
System.out.println(s1 == s2);
System.out.println(s1.equals(s2));

對於這種題,你總能很快的給出標准答案:==比較的是對象地址,equals方法比較的是真正的字符數組。所以輸出的是false和true。

上面的屬於最低階的題目,沒有什么難度。

現在這種老套的題目已經慢慢消失了,取而代之的是有一些變形的新題目:

String s1 = "aa";
String s2 = "bb";
String str1 = s1 + s2;
String str2 = "aabb";
//輸出什么呢???
System.out.println(str1 == str2);

final String s3 = "cc";
final String s4 = "dd";
String str3 = s3 + s4;
String str4 = "ccdd";
//又輸出什么呢???
System.out.println(str3 == str4);

難度提升了一些,但思考一下也不難得出答案是false和true。

今天的文章就是以這幾個題目展開的。

String對象的創建

先簡單看一下String類的結構:

image-20210122222326753

可以發現,String里面有一個value屬性,是真正存儲字符的char數組。

在執行String s = "xyz";的時候,在堆區創建了一個String對象,一個char數組對象。

image-20210123134243855

如何證明創建了一個String對象和一個char數組對象呢?我們可以通過IDEA的Debug功能驗證:

15

注意看我截圖的位置,在執行完String s = "xyz";之后,再次點擊load classes,Diff欄的String和char[]分別加了1,表示在內存中新增了一個char數組對象和一個String對象。

現在,我們再來看String s = new String("xyz");創建了幾個對象。

14

從這張Debug動圖中,我們可以得出在String s = new String("xyz");之后,創建了兩個String對象和一個char數組對象。

又因為String s = new String("xyz");s引用只能指向一個對象,可以畫出內存分布圖:

image-20210123135550260

從圖中可以看到,在堆區,有兩個String對象,這兩個String對象的value都指向同一個char數組對象。

那么問題來了,下面的那個String對象根本就沒被引用,也就是說他沒有被用到,那么它到底是干什么的呢?

占了內存空間又不使用,難道這是JDK的設計缺陷?

image-20210123140717179

很顯然不是JDK的缺陷,JDK雖然確實有設計缺陷,但不至於這么明顯,這么愚蠢。

那下面的那個String對象是干什么的呢?

答案是用於駐留到字符串常量池中去的,注意,這里我用了一個駐留,並不是直接把對象放到字符串常量池里面去,有什么區別我們后面再講。

這里出現了字符串常量池的概念,我在String s = new String("xyz")創建了幾個實例你真的能答對嗎?中也有過比較詳細的介紹,有興趣的可以去看一下,這里不再重復了。

你只需要知道,字符串常量池在JVM源碼中對應的類是StringTable,底層實現是一個Hashtable。

image-20210123154722863

我們以String s = new String("xyz");為例:

首先去找字符串常量池找,看能不能找到“xyz”字符串對應對象的引用,如果字符串常量池中找不到:

  • 創建一個String對象和char數組對象
  • 將創建的String對象封裝成HashtableEntry,作為StringTable的value進行存儲
  • new String("xyz")會在堆區又創建一個String對象,char數組直接指向創建好的char數組對象

如果字符串常量池中能找到:

  • new String("xyz")會在堆區創建一個對象,char數組直接指向已經存在的char數組對象
image-20210123151830718

String s = "xyz";是怎么樣的邏輯:

首先去找字符串常量池找,看能不能找到“xyz”字符串的引用,如果字符串常量池中能找不到:

  • 創建一個String對象和char數組對象
  • 將創建的String對象封裝成HashtableEntry,作為StringTable的value進行存儲
  • 返回創建的String對象

如果字符串常量池中能找到:

  • 直接返回找到引用對應的String對象
image-20210123153425794

總結而言就是:

對於String s = new String("xyz");這種形式創建字符串對象,如果字符串常量池中能找到,創建一個String對象;如果如果字符串常量池中找不到,創建兩個String對象。

對於String s = "xyz";這種形式創建字符串對象,如果字符串常量池中能找到,不會創建String對象;如果如果字符串常量池中找不到,創建一個String對象。

image-20210123171825252

所以,在日常開發中,能用String s = "xyz";盡量不用String s = new String("xyz");,因為可以少創建一個對象,節省一部分空間。

需要強調的是,字符串常量池存的不是字符串也不是String對象,而是一個個HashtableEntry,HashtableEntry里面的value指向的才是String對象,為了不讓表述變得復雜,我省略了HashtableEntry的存在,但不代表它就不存在。

上文提到的駐留就是新建HashtableEntry指向String對象,並把HashtableEntry存入字符串常量池的過程。

在網上一些文章中,一些作者可能是為了讓讀者更好的理解,省略了一些這些,一定要注意辨別區分。

image-20210123160353095

達成以上共識之后,我們再回顧一下那個老套的筆試題。

String s1 = new String("xyz");
String s2 = "xyz";
//為什么輸出的是false呢?
System.out.println(s1 == s2);
//為什么輸出的是true呢?
System.out.println(s1.equals(s2));

有了上面的基礎之后,我們畫出對應的內存圖,s1 == s2為什么是false就一目了然了。

image-20210123155156910

因為equals方法比較的真正的char數據,而s1和s2最終指向的都是同一個char數組對象,所以s1.equals(s2)等於true。

關於他們最終指向的都是同一個char數組對象這一觀點,也可以通過反射證明:

image-20210123170204407

我修改了str1指向的String對象的value,str2指向的對象也被影響了。

image-20210123222415172

字符串拼接

現在,我們再來看一下變式題:

String s1 = "aa";
String s2 = "bb";
String str1 = s1 + s2;
String str2 = "aabb";
//為什么輸出的是false
System.out.println(str1 == str2);

對於這個題目,我們需要先看一下這段代碼的字節碼。

image-20210123161329482

字節碼指令看不懂沒有關系,看我用紅色框框起來的部分就行了,可以看到居然出現了StringBuilder。

什么意思呢,就是說String str1 = s1 + s2;會被編譯器會優化成new StringBuilder().append("aa").append("bb").toString();

StringBuilder里面的append方法就是對char數組進行操作,那StringBuilder的toString方法做了什么呢?

image-20210123221900789

從源碼中可以看到,StringBuilder里面的toString方法調用的是String類里面的String(char value[], int offset, int count)構造方法,這個方法做了什么呢?

  • 根據參數復制一份char數組對象。復制了一份!
  • 創建一個String對象,String對象的value指向復制的char數組對象。

注意,並沒有駐留到字符串常量池里面去,這個很關鍵!!!畫一個圖理解一下:

image-20210123164646528

也就是說str2指向的String對象並沒有駐留到字符串常量池,而str1指向的對象駐留到字符串常量池里面去了,且他們並不是同一個對象。所以str1 == str2還是false

因為復制一份char數組對象,所以如果我們改變其中一個char數組的話,另一個也不會造成影響:

image-20210123170038866

把其中String變成丑比之后,另一個還是帥比,也說明了兩個String對象用的不是同一份char數組。

2abe2cc517a513e4ac5fcec0d3669b22

intern方法

上面說到,調用StringBuilder的toString方法創建的String對象是不會駐留到字符串常量池的,那如果我偏要駐留到字符串常量池呢?有沒有辦法呢?

有的,String類的intern方法就可以幫你完成這個事情。

以這段代碼為例:

String s1 = "aa";
String s2 = "bb";
String str = s1 + s2;
str.intern();

在執行str.intern();之前,內存圖是這樣的:

image-20210123174512400

在執行str.intern();之后,內存圖是這樣的:

image-20210123174805405

intern方法就是創建了一個HashtableEntry對象,並把value指向String對象,然后把HashtableEntry通過hash定位存到對應的字符串成常量池中。當然,前提是字符串常量池中原來沒有對應的HashtableEntry。

沒了,intern方法,就是這么簡單,一句話給你說清楚了。

關於intern方法,還有一個很有趣的故事,有興趣的可以去看一下why神的這篇文章《深入理解Java虛擬機》第2版挖的坑終於在第3版中被R大填平了

編譯優化

寫到這里,好像只有一個坑沒有填。就是這個題為什么輸出的是true。

final String s3 = "cc";
final String s4 = "dd";
String str3 = s3 + s4;
String str4 = "ccdd";
//為什么輸出的是true呢???
System.out.println(str3 == str4);

這道題和上面那道題相比,有點相似,在原來的基礎上加了兩個final關鍵字。我們先看一下這段代碼的字節碼:

image-20210123171346440
image-20210123171437557

又是一段字節碼指令,不需要看懂,你點一下#4,居然就可以看到“ccdd”字符串。

原來,用final修飾后,JDK的編譯器會識別優化,會把String str3 = s3 + s4;優化成String str3 = "ccdd"

image-20210123223456766

所以原題就相當於:

String str3 = "ccdd";
String str4 = "ccdd";
//為什么輸出的是true呢???
System.out.println(str3 == str4);

這樣的題目還難嗎?是不是那不管str3和str4怎么比,肯定是相等的。

總結

String對於Java程序員來說就是“最熟悉的陌生人”,你說String簡單,它確實簡單。你說它難,深究起來確實也有難度,但這些題目,只要你腦海里有一副內存圖就會很簡單。

面試題也只會越來越難,這個行業看起來也越來越內卷,但只要我學的快,內卷就卷不到我。

好了,今天就寫到了,我要去打游戲了。

希望這篇文章,能對你有一點幫助。

寫在最后(求關注)

我對每一篇發出去的文章負責,文中涉及知識理論,我都會盡量在官方文檔和權威書籍找到並加以驗證。但即使這樣,我也不能保證文章中每個點都是正確的,如果你發現錯誤之處,歡迎指出,我會對其修正。

創作不易,為了更好的表達,需要畫很多圖,這些都是我自己動手用PPT畫的,畫圖也很辛苦的!

image-20210123180803720

所以,不要猶豫了,給點正反饋,答應我,一鍵三連(關注、點贊、再看)好嗎?

我是CoderW,一個程序員。

謝謝你的閱讀,我們下期再見!

更多精彩關注微信公眾號【CoderW】


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM