字符串是Java程序中最常用的數據結構之一。在Java中String類已經重載了"+"。也就是說,字符串可以直接使用"+"進行連接,如下面代碼所示:
String s = "abc" + "ddd";
但這樣做真的好嗎?當然,這個問題不能簡單地回答yes or no。要根據具體情況來定。在Java中提供了一個StringBuilder類(這個類只在J2SE5及以上版本提供,以前的版本使用StringBuffer類),這個類也可以起到"+"的作用。那么我們應該用哪個呢?
下面讓我們先看看如下的代碼:
String s = "abc"; String ss = "ok" + s + "xyz" + 5; System.out.println(ss);
上面的代碼將會輸出正確的結果。從表面上看,對字符串和整型使用"+"號並沒有什么區別,但事實真的如此嗎?下面讓我們來看看這段代碼的本質。
我們首先使用反編譯工具(如jdk帶的javap、或jad)將TestSimplePlus反編譯成Java Byte Code,其中的奧秘就一目了然了。在本文將使用jad來反編譯,命令如下:jad -o -a -s d.java TestSimplePlus.class
反編譯后的代碼如下:
1 String s = "abc"; 2 String ss = (new StringBuilder("ok")).append(s).append("xyz").append(5).toString(); 3 System.out.println(ss);
讀者可能看到上面的Java字節碼感到迷糊,不過大家不必擔心。本文的目的並不是講解Java Byte Code,因此,並不用了解具體的字節碼的含義。
使用jad反編譯的好處之一就是可以同時生成字節碼和源代碼。這樣可以進行對照研究。從上面的代碼很容易看出,雖然在源程序中使用了"+",但在編譯時仍然將"+"轉換成StringBuilder。因此,我們可以得出結論,在Java中無論使用何種方式進行字符串連接,實際上都使用的是StringBuilder。
那么是不是可以根據這個結論推出使用"+"和StringBuilder的效果是一樣的呢?這個要從兩個方面的解釋。如果從運行結果來解釋,那么"+"和StringBuilder是完全等效的。但如果從運行效率和資源消耗方面看,那它們將存在很大的區別。
當然,如果連接字符串行表達式很簡單(如上面的順序結構),那么"+"和StringBuilder基本是一樣的,但如果結構比較復雜,如使用循環來連接字符串,那么產生的Java Byte Code就會有很大的區別。先讓我們看看如下的代碼:
String s = ""; Random rand = new Random(); for (int i = 0; i < 10; i++){ s = s + rand.nextInt(1000) + " "; } System.out.println(s);
上面的代碼返編譯后的Java Byte Code如下:
String s = ""; Random rand = new Random(); for(int i = 0; i < 10; i++) s = (new StringBuilder(String.valueOf(s))).append(rand.nextInt(1000)).append(" ").toString(); System.out.println(s);
大家可以看到,雖然編譯器將"+"轉換成了StringBuilder,但創建StringBuilder對象的位置卻在for語句內部。這就意味着每執行一次循環,就會創建一個StringBuilder對象(對於本例來說,是創建了10個StringBuilder對象),雖然Java有垃圾回收器,但這個回收器的工作時間是不定的。如果不斷產生這樣的垃圾,那么仍然會占用大量的資源。解決這個問題的方法就是在程序中直接使用StringBuilder來連接字符串,代碼如下:
1 Random rand = new Random(); 2 StringBuilder result = new StringBuilder(); 3 for (int i = 0; i < 10; i++){ 4 result.append(rand.nextInt(1000)); 5 result.append(" "); 6 } 7 System.out.println(result.toString());
上面代碼反編譯后的結果如下:
Random rand = new Random(); StringBuilder result = new StringBuilder(); for(int i = 0; i < 10; i++){ result.append(rand.nextInt(1000)); result.append(" "); }
System.out.println(result.toString());
從上面的反編譯結果可以看出,創建StringBuilder的代碼被放在了for語句外。雖然這樣處理在源程序中看起來復雜,但卻換來了更高的效率,同時消耗的資源也更少了。
在使用StringBuilder時要注意,盡量不要"+"和StringBuilder混着用,否則會創建更多的StringBuilder對象,如下面代碼所:
for (int i = 0; i < 10; i++){ result.append(rand.nextInt(1000)); result.append(" "); }
改成如下形式:
for (int i = 0; i < 10; i++){ result.append(rand.nextInt(1000) + " "); }
則反編譯后的結果如下:
for(int i = 0; i < 10; i++){ result.append((new StringBuilder(String.valueOf(rand.nextInt(1000)))).append(" ").toString()); }
從上面的代碼可以看出,Java編譯器將"+"編譯成了StringBuilder,這樣for語句每循環一次,又創建了一個StringBuilder對象。如果將上面的代碼在JDK1.4下編譯,必須將StringBuilder改為StringBuffer,而JDK1.4將"+"轉換為StringBuffer(因為JDK1.4並沒有提供StringBuilder類)。StringBuffer和StringBuilder的功能基本一樣,只是StringBuffer是線程安全的,而StringBuilder不是線程安全的。因此,StringBuilder的效率會更高。