Java StringBuilder 高性能用法總結


StringBuilder 誤解:

1. Java編譯優化后+和StringBuilder的效果一樣;

2. StringBuilder不是線程安全的,為了“安全”起見最好還是用StringBuffer;

3. 永遠不要自己拼接日志信息的字符串,交給slf4j來。

初始長度好重要,值得說四次。

StringBuilder的內部有一個char[], 不斷的append()就是不斷的往char[]里填東西的過程。

new StringBuilder() 時char[]的默認長度是16,然后,如果要append第17個字符,怎么辦?

用System.arraycopy成倍復制擴容!!!!

這樣一來有數組拷貝的成本,二來原來的char[]也白白浪費了要被GC掉。可以想見,一個129字符長度的字符串,經過了16,32,64, 128四次的復制和丟棄,合共申請了496字符的數組,在高性能場景下,這幾乎不能忍。

所以,合理設置一個初始值多重要。

但如果我實在估算不好呢?多估一點點好了,只要字符串最后大於16,就算浪費一點點,也比成倍的擴容好。

Liferay的StringBundler類

Liferay的StringBundler類提供了另一個長度設置的思路,它在append()的時候,不急着往char[]里塞東西,而是先拿一個String[]把它們都存起來,到了最后才把所有String的length加起來,構造一個合理長度的StringBuilder。

但,還是浪費了一倍的char[]

浪費發生在最后一步,StringBuilder.toString()

// Create a copy, don't share the array
return new String(value, 0, count);

String的構造函數會用 System.arraycopy()復制一把傳入的char[]來保證安全性不可變性,如果故事就這樣結束,StringBuilder里的char[]還是被白白犧牲了。

為了不浪費這些char[],一種方法是用Unsafe之類的各種黑科技,繞過構造函數直接給String的char[]和count屬性賦值,但很少人這樣做。

另一個靠譜一些的辦法就是重用StringBuilder。而重用,還解決了前面的長度設置問題,因為即使一開始估算不准,多擴容幾次之后也夠了。

重用StringBuilder

這個做法來源於JDK里的BigDecimal類(沒事看看JDK代碼多重要),SpringSide里將代碼提取成StringBuilderHolder,里面只有一個函數

public StringBuilder getStringBuilder() {
    sb.setLength(0);
    return sb;
}

 

StringBuilder.setLength()函數只重置它的count指針,而char[]則會繼續重用,而toString()時會把當前的count指針也作為參數傳給String的構造函數,所以不用擔心把超過新內容大小的舊內容也傳進去了。可見,StringBuilder是完全可以被重用的。

為了避免並發沖突,這個Holder一般設為ThreadLocal,標准寫法見BigDecimal或StringBuilderHolder的注釋

+ 與 StringBuilder

String s = “hello ” + user.getName();

 

這一句經過javac編譯后的效果,的確等價於使用StringBuilder,但沒有設定長度。

String s = new StringBuilder().append(“hello”).append(user.getName());

 

但是,如果像下面這樣:

String s = “hello ”;
// 隔了其他一些語句
s = s + user.getName();

 

每一條語句,都會生成一個新的StringBuilder,這里就有了兩個StringBuilder,性能就完全不一樣了。如果是在循環體里s+=i; 就更加多得沒譜。

據R大說,努力的JVM工程師們在運行優化階段, 根據+XX:+OptimizeStringConcat(JDK7u40后默認打開),把相鄰的(中間沒隔着控制語句) StringBuilder合成一個,也會努力的猜長度。

所以,保險起見還是繼續自己用StringBuilder並設定長度好了。

StringBuffer 與 StringBuilder

StringBuffer與StringBuilder都是繼承於AbstractStringBuilder,唯一的區別就是StringBuffer的函數上都有synchronized關鍵字

那些說StringBuffer “安全”的同學,其實你幾時看過幾個線程輪流append一個StringBuffer的情況???

永遠把日志的字符串拼接交給slf4j??

logger.info("Hello {}", user.getName());

對於不知道要不要輸出的日志,交給slf4j在真的需要輸出時才去拼接的確能省節約成本。

但對於一定要輸出的日志,直接自己用StringBuilder拼接更快。因為看看slf4j的實現,實際上就是不斷的indexof("{}"), 不斷的subString(),再不斷的用StringBuilder拼起來而已,沒有銀彈。

PS. slf4j中的StringBuilder在原始Message之外預留了50個字符,如果可變參數加起來長過50字符還是得復制擴容......而且StringBuilder也沒有重用。

小結

StringBuilder默認的寫法,會為129長度的字符串拼接,合共申請625字符的數組。所以高性能的場景下,永遠要考慮用一個ThreadLocal 可重用的StringBuilder。而且重用之后,就不用再玩猜長度的游戲了。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM