C# Random類的正確應用


Random類介紹

Random類一個用於產生偽隨機數字的類。這里的偽隨機表示有隨機性但是可以基於算法模擬出隨機規律。
Random類的構造方式有兩種。

  • Random r= new Random()。會以當前系統時間作為默認種子構建一個隨機序列
  • Random r = new Random(unchecked((int)DateTime.Now.Ticks));。自定義一個種子,通常會使用時間Ticks。

隨機性保證

由於Random的偽隨機性,所以如果多個Random隨機序列生成的時間間隔很短(官方說法15ms內),那么他們產生的隨機數會大概率相同。如下列代碼

    /// <summary>
    /// 錯誤的Random構建。
    /// </summary>
    public static void Bad_Random()
    {
        //正確做法應當將 Random構建防止循環外。
        //Random創建間隔時間極短的情況下,隨機算法序列會基本一致,倒是隨機性也是一致的
        //var r = new Random();
        for (int i = 0; i < 10; i++)
        {
            var r = new Random();
            var val = r.Next(1, 100);
            Console.WriteLine(val);
        }
    }

運行結果:

所以在生產中通常可以考慮將Random單例化,以保證其隨機算法的序列獨一性。這也是官方推薦的方式。

Instead of instantiating individual Random objects, we recommend that you create a single Random instance to generate all the random numbers needed by your app. 

這個問題在.net core下官方組件已對Random的構建作優化,所以上面的案例代碼如果放在.net core項目下運行,你會發現可以正確的生成隨機數。有興趣的小伙伴可以自己嘗試一下。不過為了代碼的延續性,還是建議Random作為單例模式設計。

那么將Random設計為單例是否就解決了隨機性的問題了呢,這時候就涉及到另外一個問題,Random不是線程安全的。如下列代碼

    /// <summary>
    /// 生成一個10位隨機數
    /// 設定了一定的復雜性,保證單線程下隨機數不重復
    /// </summary>
    /// <param name="random">Random.</param>
    /// <returns>隨機數.</returns>
    private static string GenerateRandomStr(Random random)
    {
        string source = "ABCDEFGHIKLMNOPQRTUVWXYZabcdefghiklmnopqrtuvwxyz";
        int length = 10;
        var list = Enumerable.Repeat(source, length)
             .Select(s => s[random.Next(s.Length)]).ToArray();
        return new string(list);
    }
    /// <summary>
    /// 單線程基本可以保證唯一性
    /// </summary>
    public static void Good_Random_In_SingleThread()
    {
        //正確做法應當將 Random構建防止循環外。
        //Random創建間隔時間極短的情況下,隨機算法序列會基本一致,倒是隨機性也是一致的
        var r = new Random();
        ConcurrentBag<string> list = new ConcurrentBag<string>();
        for (int i = 0; i < 20000; i++)
        {
            var val = GenerateRandomStr(r);
            list.Add(val);
        }

        Console.WriteLine($"單線程下重復數據有:{20000 - list.Distinct().Count()}");
    }

    /// <summary>
    /// 多線程下的Random構建。
    /// Bad案例,Random非線程安全
    /// 多線程高並發情況下,會出現概率重復
    /// </summary>
    public static void Bad_Random_In_MultThreads()
    {
        var r = new Random(unchecked((int)DateTime.Now.Ticks));
        ConcurrentBag<string> list = new ConcurrentBag<string>();

        var t1 = Task.Run(() =>
        {
            for (int i = 0; i < 10000; i++)
            {
                var val = GenerateRandomStr(r);
                list.Add(val);
            }
        });

        var t2 = Task.Run(() =>
        {
            for (int i = 0; i < 10000; i++)
            {
                var val = GenerateRandomStr(r);
                list.Add(val);
            }
        });

        Task.WaitAll(t1, t2);

        Console.WriteLine($"線程1和線程2的重復數據有:{20000 - list.Distinct().Count()}");
    }

運行結果:

這種重復率在生產環境上是不可接受的。那么產生的原因是什么呢?根源還是在偽隨機線程不安全上。我們可以想象下,一個Random實例中基於隨機算法產生的一個隨機數序列,在單線程下pop出一個隨機數,然后指向下一個隨機數。而在高並發的多線程情況下,指向下一個隨機數的動作還未完成時,另一個線程又來請求pop,這樣相同的隨機數被重復pop了。

網上有很多多線程下Random的解決方案,我查閱了一些感覺都不是很好。以下是我的解決方案。用到了 ThreadLocal。這個類詳細的作用大家可以自己去查閱,這里大家只需要知道這個類可以保證它包含的對象只能線程內獨享。簡單說,同一類型對象 每個線程都獨有一個Random實例互不影響。

    //利用ThreadLocal 實現每個線程下Random獨有
    //再通過seed原子性變更,保證每個Random的seed不同而生成的隨機數列也不同
    private static int seed = 100;
    private static ThreadLocal<Random> threadLocal = new ThreadLocal<Random>(() => new Random(Interlocked.Increment(ref seed)));

    /// <summary>
    /// 多線程下的Random構建。
    /// </summary>
    public static void Good_Random_In_MultThreads()
    {
        ConcurrentBag<string> list = new ConcurrentBag<string>();

        var t1 = Task.Run(() =>
        {
            for (int i = 0; i < 10000; i++)
            {
                var val = GenerateRandomStr(threadLocal.Value);
                list.Add(val);
            }
        });

        var t2 = Task.Run(() =>
        {
            for (int i = 0; i < 10000; i++)
            {
                var val = GenerateRandomStr(threadLocal.Value);
                list.Add(val);
            }
        });

        Task.WaitAll(t1, t2);

        Console.WriteLine($"[ThreadLocal模式]線程1和線程2的重復數據有:{20000 - list.Distinct().Count()}");
    }

運行結果:

由此可見,基於ThreadLocal的特性,並區別了每個線程下的seed都不一樣,從而保證每個Random的隨機性也不行一樣。

那么到這里Random的隨機性問題解決了嗎??
再深入思考下,對於集群部署情況,多台服務器同時運行,上述的Random隨機性能保證嗎?聰明的小伙伴應該能想到在不同服務器上,由於初始seed相同,可能又導致Random的隨機性相同的情況發生。

那么解決方案也很簡單,保證每台服務器的初始seed不同即可。這里的解決方案很多,不限於機器編號、IP地址后幾位、啟動時間(Environment.TickCount)等等。

這樣,到這里Random的隨機性問題終於可以告一段落了。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM