c#不可忍受之慢——誰是罪魁禍首


前些日子,爆出N篇說c#/.net太慢的,要求刪除c#/.net部分特性的文章。
撇開那些文章不說,c#/.net慢似乎是業界公認的鐵則,不論大家如何證明c#/.net其實不比c++慢多少,但是應用程序級別的性能卻依然這么慢。
那么c#/.net慢在哪里?
很不幸的是大部分c#程序是被大部分程序員拖慢的,也許這個結論不太容易被人接受,卻是一個廣泛存在的。

例如:String的操作

幾乎所有的程序都有String操作,至少90%的程序需要忽略大小寫的比較,檢查一下代碼,至少其中大半的應用程序有類似這樣的代碼:

if (str1.ToUpper() == str2.ToUpper())

或者ToLower版的,甚至我還看到過有個Web的HttpModule里面寫上了:

for (int i = 0; i < strs.Count; i++) if (value.ToUpper() == strs[i].ToUpper())

想一下,每個頁面請求過來,都要執行這樣一段代碼,大片大片的創建string實例,更誇張的是還有人說這是用空間換時間。。。

性能測試

說這個方法慢,也許還有人不承認,認為這個就是最好的方法,所以這里要用具體測試來擺個事實。

首先准備一個測試性能的方法:

private static TResult MeasurePerformance<TArg, TResult>(Func<TArg, TResult> func, TArg arg, int loop)
{
    GC.Collect();
    int gc0 = GC.CollectionCount(0);
    int gc1 = GC.CollectionCount(1);
    int gc2 = GC.CollectionCount(2);
    TResult result = default(TResult);
    Stopwatch sw = Stopwatch.StartNew();
    for (int i = 0; i < loop; i++)
    {
        result = func(arg);
    }
    Console.WriteLine(sw.ElapsedMilliseconds.ToString() + "ms");
    Console.WriteLine("GC 0:" + (GC.CollectionCount(0) - gc0).ToString());
    Console.WriteLine("GC 1:" + (GC.CollectionCount(1) - gc1).ToString());
    Console.WriteLine("GC 2:" + (GC.CollectionCount(2) - gc2).ToString());
    return result;
}

然后來准備一個堆string:

private static List<string> CreateStrings()
{
    List<string> strs = new List<string>(10000);
    char[] chs = new char[3];
    for (int i = 0; i < 10000; i++)
    {
        int j = i;
        for (int k = 0; k < chs.Length; k++)
        {
            chs[k] = (char)('a' + j % 26);
            j = j / 26;
        }
        strs.Add(new string(chs));
    }
    return strs;
}

然后來看看ToUpper的實現:

private static bool ImplementByToUpper(List<string> strs, string value)
{
    for (int i = 0; i < strs.Count; i++)
        if (value.ToUpper() == strs[i].ToUpper()) return true;
    return false;
}

最后准備好main方法:

List<string> strs = CreateStrings();
bool result;
Console.WriteLine("Use ImplementByToUpper");
result = MeasurePerformance(s => ImplementByToUpper(strs, s), "yZh", 1000);
Console.WriteLine("result is " + result.ToString());
Console.ReadLine();

來看看執行結果:

Use ImplementByToUpper
2192ms
GC 0:247
GC 1:0
GC 2:0
result is True

來個對比測試,用string.Equals來測試一下:

private static bool ImplementByStringEquals(List<string> strs, string value) 
{ 
    for (int i = 0; i < strs.Count; i++) 
        if (string.Equals(value, strs[i], StringComparison.CurrentCultureIgnoreCase)) return true;
    return false; 
}

來看看執行結果:

Use ImplementByStringEquals
1117ms
GC 0:0
GC 1:0
GC 2:0
result is True

對比一下,使用ToUpper的速度要慢一倍,並且有大量的0代垃圾對象。那些號稱是用空間換時間的人可以反思一下了,用空間換來了什么?負時間嗎?

例如:字典類的使用

繼續說string的場景,有些人也許會想到用Hash表等類似結構來加速,不錯,這是個好主意,只不過,Hash表不一定總是最佳方案,什么不相信?還是做個測試吧:

private static bool ImplementByHashSet(List<string> strs, string value)
{
    HashSet<string> set = new HashSet<string>(strs, StringComparer.CurrentCultureIgnoreCase);
    return set.Contains(value);
}

看看執行結果:

Use ImplementByHashSet
5114ms
GC 0:38
GC 1:38
GC 2:38
result is True

驚訝吧,速度比用ToUpper還慢了1倍多,而且2代垃圾也38次的回收(執行2代垃圾回收時,會強制執行1代和0代垃圾回收)。

不過使用Hash表等類似來加速這個想法本身是一個很正確的想法,不過前提是Hash表本身能夠緩存,例如:

private static Func<string, bool> ImplementByHashSet2(List<string> strs)
{
    HashSet<string> set = new HashSet<string>(strs, StringComparer.CurrentCultureIgnoreCase);
    return set.Contains;
}

然后把main的方法修改為:

Console.WriteLine("Use ImplementByHashSet2");
result = MeasurePerformance(s =>
{
    var f = ImplementByHashSet2(strs); 
    bool ret = false; 
    for (int i = 0; i < 1000; i++) 
    { 
        ret = f(s);
    }
    return ret;
}, "yZh", 1);
Console.WriteLine("result is " + result.ToString());
Console.ReadLine();

再看看結果:

Use ImplementByHashSet2
6ms
GC 0:0
GC 1:0
GC 2:0
result is True

性能出現了飛躍性的增長。

結語

是什么拖慢了c#/.net?簡單的說:不必要的創建對象,不必要的同步,循環執行低效的方法(例如被重點批斗的反射,不過ms並沒讓你在循環里面使用Invoke),使用低效的數據結構和算法(看看緩存情況下Hash表類似結構的驚人表現,就知道區別了)

c#/.net的低門檻確實在一定程度上有利於把更多的程序員拉入c#/.net,但是也確實把整個c#/.net程序的代碼水平降低了不少,這一點確實很令人擔憂。

最后別忘了一點,一個系統能有多少性能,不是由這個系統中性能最好的部分決定的,而是由這個系統中性能最差的部分所決定的。配一台有16g內存,100t硬盤,加上頂級的顯卡,卻配上386的cpu,這台電腦的性能就是386的性能。同樣,c#/.net再好,寫程序的人水平差,寫出來的程序的性能自然也就差了。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM