C# String 字符拼接測試(“+”、string.Format、StringBuilder 比較)


對於字符串的拼接自己一直有疑問,在何時該用什么方法來拼接?哪種方法更好、更適合。

幾種方法


1、“+” 拼接字符串

現在在 C# 中,字符串進行拼接,可以直接用 “+” 而且可以直接用於數字類型的而不必轉換(整形、浮點等都可以)

string a = "1";

a = a + "1";

string b = "2" + 1.2345;

對於使用多個 “+” 的,編譯器會優化為:

 string a = "a" + 1 + "b" + 2 + "c" + 3 + "d" + 4;
 string a = string.Concat(new string[]{});

通過分析string.Concat(params string[] values)的實現可以知道:先計算目標字符串的長度,然后申請相應的空間,最后逐一復制,時間復雜度為o(n),常數為1。

固定數量的字符串連接效率最高的是+。

但是字符串的連+不要拆成多條語句,比如:

            string a = "a";
            a += 1;
            a += "b";
            a += 2;
            a += "c";
            a += 3;

這樣的代碼,不會被優化為string.Concat,就變成了性能殺手,因為第i個字符串需要復制n-i次,時間復雜度就成了o(n^2)。

那么用 “+” 拼接字符串也是要正確運用。

2、string.Format 拼接字符串

該形式可以同時拼接多個字符串

string.Format("{0}{1}{2}{3}","a","b","c","d");

它的底層是 StringBuilder,在此基礎進行了多層的封裝,說是效率和 StringBuilder 差不多,這個不清楚,可以看下面的實驗;

3、StringBuilder 拼接字符串

StringBuilder str = new StringBuilder();
str.Append("a");

StringBuilder 只分配一次內存,如果第二次連接內存不足,則修改內存大小;它每次默認分配16字節,如果內存不足,則擴展到32字節,如果仍然不足,繼續成倍擴展。

如果頻繁的擴展內存,效率大打折扣,因為分配內存,時間開銷相對比較大。如果事先能准確估計程序執行過程中所需要的內存,從而一次分配足內存,效率大大提高。

如果字符串的數量不固定,就用StringBuilder,一般情況下它使用2n的空間來保證o(n)的整體時間復雜度,常數項接近於2。

因為這個算法的實用與高效,.net類庫里面有很多動態集合都采用這種犧牲空間換取時間的方式,一般來說效果還是不錯的。

4、List<string> 拼接字符串

            List<string> str =new List<string>();
            str.Add("1");
            str.Add("a");
            str.Add("2");
            str.Add("b");
            string.Join("",str);

它可以轉換為string[]后使用string.Concat或string.Join,很多時候效率比StringBuiler更高效。List與StringBuilder采用的是同樣的動態集合算法,時間復雜度也是O(n),與StringBuilder不同的是:List的n是字符串的數量,復制的是字符串的引用;StringBuilder的n是字符串的長度,復制的數據。不同的特性決定的它們各自的適應環境,當子串比較大時建議使用List<string>,因為復制引用比復制數據划算。而當子串比較小,比如平均長度小於8,特別是一個一個的字符,建議使用StringBuilder。

MSDN中關於StringBuilder的性能注意事項:

Concat 和 AppendFormat 方法都將新數據串連到一個現有的 String 或 StringBuilder 對象。String 對象串聯操作總是用現有字符串和新數據創建新的對象。StringBuilder 對象維護一個緩沖區,以便容納新數據的串聯。如果有足夠的空間,新數據將被追加到緩沖區的末尾;否則,將分配一個新的、更大的緩沖區,原始緩沖區中的數據被復制到新的緩沖區,然后將新數據追加到新的緩沖區。

String 或 StringBuilder 對象的串聯操作的性能取決於內存分配的發生頻率。String 串聯操作每次都分配內存,而 StringBuilder 串聯操作僅當 StringBuilder 對象緩沖區太小而無法容納新數據時才分配內存。因此,如果串聯固定數量的 String 對象,則 String 類更適合串聯操作。這種情況下,編譯器甚至會將各個串聯操作組合到一個操作中。如果串聯任意數量的字符串,則 StringBuilder 對象更適合串聯操作;例如,某個循環對用戶輸入的任意數量的字符串進行串聯。

 

測試

測試1:

 

            Stopwatch watch = new Stopwatch();
            watch.Start();

            string a = "1";

            for (int i = 0; i < 1000000; i++)
            {
                a = a + "1" ;
            }

            watch.Stop();

            Console.WriteLine("+ 用時:" + watch.ElapsedMilliseconds + " ms");

            string b = "1";
            watch.Restart();

            for (int i = 0; i < 1000000; i++)
            {
                b = string.Format("{0}{1}", b, "1");
            }

            watch.Stop();

            Console.WriteLine("Format 用時:" + watch.ElapsedMilliseconds + " ms");

            StringBuilder str = new StringBuilder();
            char charT = '1';
            watch.Restart();

            for (int i = 0; i < 1000000; i++)
            {
                str.Append("1");
            }

            watch.Stop();

            Console.WriteLine("StringBuilder 用時:" + watch.ElapsedMilliseconds + " ms");    

 

對上面的幾種分別進行100000 次循環,並計時,結果是:

 

進行1000000 次循環拼接字符串時,時間太長,沒有截圖

 從上面兩個來看,String.Format 效率並不高,遠遠達不到 StringBuildr 的效率,也差於 “+” 拼接字符串;

對代碼進行改進:

            Stopwatch watch = new Stopwatch();
            watch.Start();

            string a = "1";

            for (int i = 0; i < 100000; i++)
            {
                a = a + "1" + "1" + "1" + "1" + "1" + "1" + "1" + "1" + "1" + "1";
            }

            watch.Stop();

            Console.WriteLine("+ 用時:" + watch.ElapsedMilliseconds + " ms");

            string b = "1";
            watch.Restart();

            for (int i = 0; i < 100000; i++)
            {
                b = string.Format("{0}{1}{2}{3}{4}{5}{6}{7}{8}{9}{10}", b, "1", "1", "1", "1", "1", "1", "1", "1", "1", "1");
            }

            watch.Stop();

            Console.WriteLine("Format 用時:" + watch.ElapsedMilliseconds + " ms");

            StringBuilder str = new StringBuilder();
            char charT = '1';
            watch.Restart();

            for (int i = 0; i < 100000; i++)
            {
                str.Append(charT, 10);
            }

            watch.Stop();

            Console.WriteLine("StringBuilder 用時:" + watch.ElapsedMilliseconds + " ms");    

 

進行 100000 次循環,每次進行10個字符,結果如下:

從這個結果看,String.Format 效率還是較差。

 

文章中部分引用自:

https://www.cnblogs.com/popzhou/p/3676691.html

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM