對於字符串的拼接自己一直有疑問,在何時該用什么方法來拼接?哪種方法更好、更適合。
幾種方法
1、“+” 拼接字符串
現在在 C# 中,字符串進行拼接,可以直接用 “+” 而且可以直接用於數字類型的而不必轉換(整形、浮點等都可以)
string a = "1"; a = a + "1"; string b = "2" + 1.2345;
對於使用多個 “+” 的,編譯器會優化為:
string a = "a" + 1 + "b" + 2 + "c" + 3 + "d" + 4; string a = string.Concat(new string[]{});
通過分析string.Concat(params string[] values)的實現可以知道:先計算目標字符串的長度,然后申請相應的空間,最后逐一復制,時間復雜度為o(n),常數為1。
固定數量的字符串連接效率最高的是+。
但是字符串的連+不要拆成多條語句,比如:
string a = "a"; a += 1; a += "b"; a += 2; a += "c"; a += 3;
這樣的代碼,不會被優化為string.Concat,就變成了性能殺手,因為第i個字符串需要復制n-i次,時間復雜度就成了o(n^2)。
那么用 “+” 拼接字符串也是要正確運用。
2、string.Format 拼接字符串
該形式可以同時拼接多個字符串
string.Format("{0}{1}{2}{3}","a","b","c","d");
它的底層是 StringBuilder,在此基礎進行了多層的封裝,說是效率和 StringBuilder 差不多,這個不清楚,可以看下面的實驗;
3、StringBuilder 拼接字符串
StringBuilder str = new StringBuilder(); str.Append("a");
StringBuilder 只分配一次內存,如果第二次連接內存不足,則修改內存大小;它每次默認分配16字節,如果內存不足,則擴展到32字節,如果仍然不足,繼續成倍擴展。
如果頻繁的擴展內存,效率大打折扣,因為分配內存,時間開銷相對比較大。如果事先能准確估計程序執行過程中所需要的內存,從而一次分配足內存,效率大大提高。
如果字符串的數量不固定,就用StringBuilder,一般情況下它使用2n的空間來保證o(n)的整體時間復雜度,常數項接近於2。
因為這個算法的實用與高效,.net類庫里面有很多動態集合都采用這種犧牲空間換取時間的方式,一般來說效果還是不錯的。
4、List<string> 拼接字符串
List<string> str =new List<string>(); str.Add("1"); str.Add("a"); str.Add("2"); str.Add("b"); string.Join("",str);
它可以轉換為string[]后使用string.Concat或string.Join,很多時候效率比StringBuiler更高效。List與StringBuilder采用的是同樣的動態集合算法,時間復雜度也是O(n),與StringBuilder不同的是:List的n是字符串的數量,復制的是字符串的引用;StringBuilder的n是字符串的長度,復制的數據。不同的特性決定的它們各自的適應環境,當子串比較大時建議使用List<string>,因為復制引用比復制數據划算。而當子串比較小,比如平均長度小於8,特別是一個一個的字符,建議使用StringBuilder。
MSDN中關於StringBuilder的性能注意事項:
Concat 和 AppendFormat 方法都將新數據串連到一個現有的 String 或 StringBuilder 對象。String 對象串聯操作總是用現有字符串和新數據創建新的對象。StringBuilder 對象維護一個緩沖區,以便容納新數據的串聯。如果有足夠的空間,新數據將被追加到緩沖區的末尾;否則,將分配一個新的、更大的緩沖區,原始緩沖區中的數據被復制到新的緩沖區,然后將新數據追加到新的緩沖區。
String 或 StringBuilder 對象的串聯操作的性能取決於內存分配的發生頻率。String 串聯操作每次都分配內存,而 StringBuilder 串聯操作僅當 StringBuilder 對象緩沖區太小而無法容納新數據時才分配內存。因此,如果串聯固定數量的 String 對象,則 String 類更適合串聯操作。這種情況下,編譯器甚至會將各個串聯操作組合到一個操作中。如果串聯任意數量的字符串,則 StringBuilder 對象更適合串聯操作;例如,某個循環對用戶輸入的任意數量的字符串進行串聯。
測試
測試1:
Stopwatch watch = new Stopwatch(); watch.Start(); string a = "1"; for (int i = 0; i < 1000000; i++) { a = a + "1" ; } watch.Stop(); Console.WriteLine("+ 用時:" + watch.ElapsedMilliseconds + " ms"); string b = "1"; watch.Restart(); for (int i = 0; i < 1000000; i++) { b = string.Format("{0}{1}", b, "1"); } watch.Stop(); Console.WriteLine("Format 用時:" + watch.ElapsedMilliseconds + " ms"); StringBuilder str = new StringBuilder(); char charT = '1'; watch.Restart(); for (int i = 0; i < 1000000; i++) { str.Append("1"); } watch.Stop(); Console.WriteLine("StringBuilder 用時:" + watch.ElapsedMilliseconds + " ms");
對上面的幾種分別進行100000 次循環,並計時,結果是:
進行1000000 次循環拼接字符串時,時間太長,沒有截圖
從上面兩個來看,String.Format 效率並不高,遠遠達不到 StringBuildr 的效率,也差於 “+” 拼接字符串;
對代碼進行改進:
Stopwatch watch = new Stopwatch(); watch.Start(); string a = "1"; for (int i = 0; i < 100000; i++) { a = a + "1" + "1" + "1" + "1" + "1" + "1" + "1" + "1" + "1" + "1"; } watch.Stop(); Console.WriteLine("+ 用時:" + watch.ElapsedMilliseconds + " ms"); string b = "1"; watch.Restart(); for (int i = 0; i < 100000; i++) { b = string.Format("{0}{1}{2}{3}{4}{5}{6}{7}{8}{9}{10}", b, "1", "1", "1", "1", "1", "1", "1", "1", "1", "1"); } watch.Stop(); Console.WriteLine("Format 用時:" + watch.ElapsedMilliseconds + " ms"); StringBuilder str = new StringBuilder(); char charT = '1'; watch.Restart(); for (int i = 0; i < 100000; i++) { str.Append(charT, 10); } watch.Stop(); Console.WriteLine("StringBuilder 用時:" + watch.ElapsedMilliseconds + " ms");
進行 100000 次循環,每次進行10個字符,結果如下:
從這個結果看,String.Format 效率還是較差。
文章中部分引用自:
https://www.cnblogs.com/popzhou/p/3676691.html