Random類介紹
Random類一個用於產生偽隨機數字的類。這里的偽隨機表示有隨機性但是可以基於算法模擬出隨機規律。
Random類的構造方式有兩種。
Random r= new Random()。
會以當前系統時間作為默認種子構建一個隨機序列Random r = new Random(unchecked((int)DateTime.Now.Ticks));。
自定義一個種子,通常會使用時間Ticks。
隨機性保證
由於Random的偽隨機性,所以如果多個Random隨機序列生成的時間間隔很短(官方說法15ms內),那么他們產生的隨機數會大概率相同。如下列代碼
/// <summary>
/// 錯誤的Random構建。
/// </summary>
public static void Bad_Random()
{
//正確做法應當將 Random構建防止循環外。
//Random創建間隔時間極短的情況下,隨機算法序列會基本一致,倒是隨機性也是一致的
//var r = new Random();
for (int i = 0; i < 10; i++)
{
var r = new Random();
var val = r.Next(1, 100);
Console.WriteLine(val);
}
}
運行結果:
所以在生產中通常可以考慮將Random單例化,以保證其隨機算法的序列獨一性。這也是官方推薦的方式。
Instead of instantiating individual Random objects, we recommend that you create a single Random instance to generate all the random numbers needed by your app.
這個問題在.net core下官方組件已對Random的構建作優化,所以上面的案例代碼如果放在.net core項目下運行,你會發現可以正確的生成隨機數。有興趣的小伙伴可以自己嘗試一下。不過為了代碼的延續性,還是建議Random作為單例模式設計。
那么將Random設計為單例是否就解決了隨機性的問題了呢,這時候就涉及到另外一個問題,Random不是線程安全的。如下列代碼
/// <summary>
/// 生成一個10位隨機數
/// 設定了一定的復雜性,保證單線程下隨機數不重復
/// </summary>
/// <param name="random">Random.</param>
/// <returns>隨機數.</returns>
private static string GenerateRandomStr(Random random)
{
string source = "ABCDEFGHIKLMNOPQRTUVWXYZabcdefghiklmnopqrtuvwxyz";
int length = 10;
var list = Enumerable.Repeat(source, length)
.Select(s => s[random.Next(s.Length)]).ToArray();
return new string(list);
}
/// <summary>
/// 單線程基本可以保證唯一性
/// </summary>
public static void Good_Random_In_SingleThread()
{
//正確做法應當將 Random構建防止循環外。
//Random創建間隔時間極短的情況下,隨機算法序列會基本一致,倒是隨機性也是一致的
var r = new Random();
ConcurrentBag<string> list = new ConcurrentBag<string>();
for (int i = 0; i < 20000; i++)
{
var val = GenerateRandomStr(r);
list.Add(val);
}
Console.WriteLine($"單線程下重復數據有:{20000 - list.Distinct().Count()}");
}
/// <summary>
/// 多線程下的Random構建。
/// Bad案例,Random非線程安全
/// 多線程高並發情況下,會出現概率重復
/// </summary>
public static void Bad_Random_In_MultThreads()
{
var r = new Random(unchecked((int)DateTime.Now.Ticks));
ConcurrentBag<string> list = new ConcurrentBag<string>();
var t1 = Task.Run(() =>
{
for (int i = 0; i < 10000; i++)
{
var val = GenerateRandomStr(r);
list.Add(val);
}
});
var t2 = Task.Run(() =>
{
for (int i = 0; i < 10000; i++)
{
var val = GenerateRandomStr(r);
list.Add(val);
}
});
Task.WaitAll(t1, t2);
Console.WriteLine($"線程1和線程2的重復數據有:{20000 - list.Distinct().Count()}");
}
運行結果:
這種重復率在生產環境上是不可接受的。那么產生的原因是什么呢?根源還是在偽隨機和線程不安全上。我們可以想象下,一個Random實例中基於隨機算法產生的一個隨機數序列,在單線程下pop出一個隨機數,然后指向下一個隨機數。而在高並發的多線程情況下,指向下一個隨機數的動作還未完成時,另一個線程又來請求pop,這樣相同的隨機數被重復pop了。
網上有很多多線程下Random的解決方案,我查閱了一些感覺都不是很好。以下是我的解決方案。用到了 ThreadLocal
。這個類詳細的作用大家可以自己去查閱,這里大家只需要知道這個類可以保證它包含的對象只能線程內獨享。簡單說,同一類型對象 每個線程都獨有一個Random實例互不影響。
//利用ThreadLocal 實現每個線程下Random獨有
//再通過seed原子性變更,保證每個Random的seed不同而生成的隨機數列也不同
private static int seed = 100;
private static ThreadLocal<Random> threadLocal = new ThreadLocal<Random>(() => new Random(Interlocked.Increment(ref seed)));
/// <summary>
/// 多線程下的Random構建。
/// </summary>
public static void Good_Random_In_MultThreads()
{
ConcurrentBag<string> list = new ConcurrentBag<string>();
var t1 = Task.Run(() =>
{
for (int i = 0; i < 10000; i++)
{
var val = GenerateRandomStr(threadLocal.Value);
list.Add(val);
}
});
var t2 = Task.Run(() =>
{
for (int i = 0; i < 10000; i++)
{
var val = GenerateRandomStr(threadLocal.Value);
list.Add(val);
}
});
Task.WaitAll(t1, t2);
Console.WriteLine($"[ThreadLocal模式]線程1和線程2的重復數據有:{20000 - list.Distinct().Count()}");
}
運行結果:
由此可見,基於ThreadLocal的特性,並區別了每個線程下的seed都不一樣,從而保證每個Random的隨機性也不行一樣。
那么到這里Random的隨機性問題解決了嗎??
再深入思考下,對於集群部署情況,多台服務器同時運行,上述的Random隨機性能保證嗎?聰明的小伙伴應該能想到在不同服務器上,由於初始seed相同,可能又導致Random的隨機性相同的情況發生。
那么解決方案也很簡單,保證每台服務器的初始seed不同即可。這里的解決方案很多,不限於機器編號、IP地址后幾位、啟動時間(Environment.TickCount)等等。
這樣,到這里Random的隨機性問題終於可以告一段落了。