隨機數生成方法


轉自:https://www.cnblogs.com/ECJTUACM-873284962/p/6926203.html

1、蒙特卡洛方法

蒙特卡羅方法又稱統計模擬法、隨機抽樣技術,是一種隨機模擬方法,以概率和統計理論方法為基礎的一種計算方法,是使用隨機數(或更常見的偽隨機數)來解決很多計算問題的方法。將所求解的問題同一定的概率模型相聯系,用電子計算機實現統計模擬或抽樣,以獲得問題的近似解。為象征性地表明這一方法的概率統計特征,數學家馮·諾依曼用聞名世界的賭城——蒙特卡羅命名(就是那個馮·諾依曼)。 
蒙特卡羅方法解題過程的主要步驟: 
a.針對實際問題建立一個簡單且便於實現的概率統計模型,使所求的量恰好是該模型的概率分布或數字特征。 
b.對模型的隨機變量建立抽樣方法,在計算機上進行模擬測試,抽取足夠多的隨機數。 
c.對模擬實驗結果進行統計分析,給出所求解的“估計”。 
d.必要時,改進模型以提高估計精度和減少實驗費用,提高模擬效率。

2、馮·諾依曼

馮·諾依曼(John von Neumann,1903~1957),20世紀最重要的數學家之一,在現代計算機、博弈論和核武器等諸多領域內有傑出建樹的最偉大的科學全才之一,被稱為“計算機之父”和“博弈論之父”。主要貢獻是:2進制思想與程序內存思想,當然還有蒙特卡洛方法。通過第一部分,可知,蒙特卡洛方法更多的是一種思想的體現(這點遠不同於快排等“嚴格”類算法),下面介紹最常見的一種應用——隨機數生成。

3、U(0,1)隨機數的產生

對隨機系統進行模擬,便需要產生服從某種分布的一系列隨機數。最常用、最基礎的隨機數是在(0,1)區間內均勻分布的隨機數,最常用的兩類數值計算方法是:乘同余法和混合同余法。

乘同余法:clip_image002其中,clip_image002[4]被稱為種子,clip_image002[6]是模,clip_image002[8]是(0,1)區間的隨機數。

混合同余法:clip_image002[10]其中,clip_image002[12]是非負整數。

這些隨機數是具有周期性的,模擬參數的選擇不同,產生的隨機數質量也有所差異。更復雜的生成方法還有:

clip_image002[14]

4、從U(0,1)到其它概率分布的隨機數

離散型隨機數的模擬

設隨機變量X的概率分布為:clip_image002[16],分布函數有clip_image002[18]

設隨機變量U~U(0,1)的均勻分布,則clip_image002[20]表明clip_image002[22]的概率與隨機變量u落在clip_image002[24]clip_image002[26]之間的概率相同。

例如:離散隨機變量X有分布律

X 0 1 2
P(x) 0.3 0.3 0.4

U是(0,1)的均勻分布,則有clip_image002[28],這樣得到的x便具有X的分布律。

連續型隨機變量的模擬

常用的有兩種方法:逆變換法和舍選法。逆變換法 
定理:設隨機變量Y的分布函數為F(y)是連續函數,而U是(0,1)上均勻分布的隨機變量。另clip_image002[30],則X和Y具有相同的分布。

證明:由定義知,X的分布函數clip_image002[32] 
所以X和Y具有相同的分布。 
這樣計算得clip_image002[40],帶入均勻分布的U,即可得到服從clip_image002[38]的隨機數Y。 
例如:設X~U(a,b),則其分布函數為

clip_image002[42]clip_image002[44]。所以生成U(0,1)的隨機數U,則clip_image002[46]便是來自U(a,b)的隨機數。

有些隨機變量的累計分布函數不存在或者難以求出,即使存在,但計算困難,於是提出了舍選法 
要產生服從clip_image002[48]的隨機數,設x的值域為[a,b],抽樣過程如下:

1.已知隨機分布clip_image002[50]且x的取值區間也為[a,b],並要求clip_image002[54],如圖: 
clip_image002[56] 
2.從clip_image002[50]中隨機抽樣得clip_image002[59],然后由clip_image002[62]的均勻分布抽樣得clip_image002[65]。 
3.接受或舍棄取樣值clip_image002[59],如果clip_image002[67]舍棄該值;返回上一步,否則接受。幾何解釋如下: 
image

常數c的選取:c應該盡可能地小,因為抽樣效率與c成反比;一般取clip_image002[69]。這里的clip_image002[50]可以取均勻分布,這樣由第二步中兩個均勻分布便能得到其他任意分布的模擬抽樣。

5、正態隨機數的生成

除了上面的反函數法和舍選法,正態隨機數還可以根據中心極限定理和Box Muller(坐標變換法)得到。

中心極限定理:如果隨機變量序列 clip_image002[72]獨立同分布,並且具有有限的數學期望和方差clip_image002[74],則對於一切clip_image002[76]

clip_image002[80] 
也就是說,當n個獨立同分布的變量和,服從clip_image002[82]的正態分布(n足夠大時)。

設n個獨立同分布的隨機變量clip_image002[84],它們服從U(0,1)的均勻分布,那么clip_image002[86]漸近服從正態分布clip_image002[88]

Box Muller方法,設(X,Y)是一對相互獨立的服從正態分布clip_image002[88]的隨機變量,則有概率密度函數: 
clip_image002[90] 
clip_image002[93],其中clip_image002[95],則clip_image002[97]有分布函數: 
clip_image002[99] 
clip_image002[101],則分布函數的反函數得:clip_image002[103]

如果clip_image002[109]服從均勻分布U(0,1),則clip_image002[107]可由clip_image002[111]模擬生成(clip_image002[115]也為均勻分布,可被clip_image002[109]代替)。令clip_image002[118]clip_image002[120]clip_image002[122]服從均勻分布U(0,1)。得: 
clip_image002[124] 
X和Y均服從正態分布。用Box Muller方法來生成服從正態分布的隨機數是十分快捷方便的。

下面介紹幾種簡單的隨機數的算法

1 生成隨機數
一般c語言中提供了隨機數生成函數,
其一是偽隨機數--rand:用於返回一個0-32767之間的偽隨機數;
其二是隨機種子函數--srand:用來初始化隨機數發生器的隨機種子
復制代碼
 1 #include <stdio.h>  2 #include <stdlib.h>  3 #include <time.h>  4  5 int main()  6 {  7 int i,j;  8 srand((int)time(0));  9 for (int i = 0; i < 10; i++) 10  { 11 for (int j = 0; j < 10; j++) 12  { 13 printf("%d ",rand()); 14  } 15 printf("\n"); 16  } 17 return 0; 18 }
復制代碼
當然也可以生成一定范圍內的隨機數
比如生成0——100之間的隨機數
復制代碼
 1 #include <stdio.h>  2 #include <stdlib.h>  3 #include <time.h>  4  5 int main()  6 {  7 int i,j;  8 srand((int)time(0));  9 for (int i = 0; i < 10; i++) 10  { 11 for (int j = 0; j < 10; j++) 12  { 13 printf("%d ",rand()*100/32767); 14  } 15 printf("\n"); 16  } 17 return 0; 18 }
復制代碼

也可以生成100——200之間的隨機數

復制代碼
 1 #include <stdio.h>  2 #include <stdlib.h>  3 #include <time.h>  4  5 int main()  6 {  7 int i,j;  8 srand((int)time(0));  9 for (int i = 0; i < 10; i++) 10  { 11 for (int j = 0; j < 10; j++) 12  { 13 printf("%d ",rand()/1000+100); 14  } 15 printf("\n"); 16  } 17 return 0; 18 }
復制代碼

使用rand()函數獲取一定范圍內的一個隨機數

如果想要獲取在一定范圍內的數的話,直接做相應的除法取余即可。

復制代碼
 1 #include<iostream>  2 #include<ctime>  3 using namespace std;  4 int main()  5 {  6 srand(time(0));  7 for(int i=0;i<10;i++)  8  {  9 //產生10以內的整數 10 cout<<rand()%10<<endl; 11  } 12 }
復制代碼
2 生成[0,1]之間均勻分布的隨機數算法
 
 
 
在這里采用一種方式生成隨機數
其中i=1,2,3.。。。
而pi就是地推倒的第i個隨機數
 
根據經驗,一般選取基數base=256.0,一般為2的整數倍;另外的兩個常數選取a=17.0 和b=139.0
 
需要注意
(1)這里的取模運算是針對浮點型數據的,而c語言中的取模運算不能用於浮點數數據的操作,這樣就需要用戶自己編寫取模的程序;
(2)ri是隨着遞推而每次更新的。因此,如果將這個算法編寫出函數,需要考慮參數是傳值還是傳地址;
 
遞推更新,所以在這里要傳地址,否則得不到結果!
復制代碼
 1 #include <stdio.h>  2  3  4 double rand0_1(double *r)  5 {  6 double base=256.0;  7 double a=17.0;  8 double b=139.0;  9 double temp1=a*(*r)+b; 10 //printf("%lf",temp1); 11 double temp2=(int)(temp1/base); //得到余數 12 double temp3=temp1-temp2*base; 13 //printf("%lf\n",temp2); 14 //printf("%lf\n",temp3); 15 *r=temp3; 16 double p=*r/base; 17 return p; 18 } 19 20 int main() 21 { 22 double r=5.0; 23 printf("output 10 number between 0 and 1:\n"); 24 for (int i = 0; i < 10; i++) 25  { 26 printf("%10.5lf\n",rand0_1(&r)); 27  } 28 return 0; 29 }
復制代碼
3 產生任意范圍內的隨機數,比如產生[m,n]之間的隨機數
這個很容易,只要將之前的[0,1]之間的隨機數這樣處理就行了
m+(m-n)*rand0_1(&r)就行了;
復制代碼
 1 #include <stdio.h>  2  3  4 double rand0_1(double *r)  5 {  6 double base=256.0;  7 double a=17.0;  8 double b=139.0;  9 double temp1=a*(*r)+b; 10 //printf("%lf",temp1); 11 double temp2=(int)(temp1/base); //得到余數 12 double temp3=temp1-temp2*base; 13 //printf("%lf\n",temp2); 14 //printf("%lf\n",temp3); 15 *r=temp3; 16 double p=*r/base; 17 return p; 18 } 19 20 int main() 21 { 22 double m=1.0,n=5.0; 23 double r=5.0; 24 printf("output 10 number between 0 and 1:\n"); 25 for (int i = 0; i < 10; i++) 26  { 27 printf("%10.5lf\n",m+(n-m)*rand0_1(&r)); 28  } 29 return 0; 30 }
復制代碼
4 正態分布的隨機數生成算法
 
符合正太分布的隨機數在研究中也很重要,下面給出一種生成正態分布數的方法

 

其中Ri表示[0,1]之間均勻分布的隨機數;
 

u為均值,  為方差,當n趨向於無窮大的時候,得到隨機的隨機分布為正態分布;

復制代碼
 1 #include <stdio.h>  2 #include <math.h>  3  4 double rand0_1(double *r)  5 {  6 double base=256.0;  7 double a=17.0;  8 double b=139.0;  9 double temp1=a*(*r)+b; 10 //printf("%lf",temp1); 11 double temp2=(int)(temp1/base); //得到余數 12 double temp3=temp1-temp2*base; 13 //printf("%lf\n",temp2); 14 //printf("%lf\n",temp3); 15 *r=temp3; 16 double p=*r/base; 17 return p; 18 } 19 20 double random_normality(double u,double t,double *r ,double n) 21 { 22 double total=0.0; 23 double result; 24 for (int i = 0; i < n; i++) 25  { 26 total+=rand0_1(r); 27  } 28 result=u+t*(total-n/2)/sqrt(n/12); 29 return result; 30 } 31 32 int main() 33 { 34 double r=5.0; 35 double u=2.0; 36 double t=3.5; 37 double n=12; 38 printf("output 10 number between 0 and 1:\n"); 39 for (int i = 0; i < 10; i++) 40  { 41 printf("%10.5lf\n",random_normality(u,t,&r,n)); 42  } 43 return 0; 44 }
復制代碼

 補充知識點:leveldb中使用了一個簡單的方式來實現隨機化數;算法的核心是seed_ = (seed_ * A) % M,

下面把源代碼貼出來,不難,可以和上面的參考下

復制代碼
 1 private:  2  uint32_t seed_;  3 public:  4 explicit Random(uint32_t s) : seed_(s & 0x7fffffffu) {  5 // Avoid bad seeds.  6 if (seed_ == 0 || seed_ == 2147483647L) {  7 seed_ = 1;  8  }  9  } 10  uint32_t Next() { 11 static const uint32_t M = 2147483647L; // 2^31-1 12 static const uint64_t A = 16807; // bits 14, 8, 7, 5, 2, 1, 0 13 // We are computing 14 // seed_ = (seed_ * A) % M, where M = 2^31-1 15 // 16 // seed_ must not be zero or M, or else all subsequent computed values 17 // will be zero or M respectively. For all other values, seed_ will end 18 // up cycling through every number in [1,M-1] 19 uint64_t product = seed_ * A; 20 21 // Compute (product % M) using the fact that ((x << 31) % M) == x. 22 seed_ = static_cast<uint32_t>((product >> 31) + (product & M)); 23 // The first reduction may overflow by 1 bit, so we may need to 24 // repeat. mod == M is not possible; using > allows the faster 25 // sign-bit-based test. 26 if (seed_ > M) { 27 seed_ -= M; 28  } 29 return seed_; 30  } 31 // Returns a uniformly distributed value in the range [0..n-1] 32 // REQUIRES: n > 0 33 uint32_t Uniform(int n) { return Next() % n; } 34 35 // Randomly returns true ~"1/n" of the time, and false otherwise. 36 // REQUIRES: n > 0 37 bool OneIn(int n) { return (Next() % n) == 0; } 38 39 // Skewed: pick "base" uniformly from range [0,max_log] and then 40 // return "base" random bits. The effect is to pick a number in the 41 // range [0,2^max_log-1] with exponential bias towards smaller numbers. 42 uint32_t Skewed(int max_log) { 43 return Uniform(1 << Uniform(max_log + 1)); 44  } 45 };
復制代碼

這里面也直接取模得到一定范圍內的隨機數,簡單明了。

總之,做個簡單的總結

C語言/C++怎樣產生隨機數:這里要用到的是rand()函數, srand()函數,和time()函數。

需要說明的是,iostream頭文件中就有srand函數的定義,不需要再額外引入stdlib.h;而使用time()函數需要引入ctime頭文件。

使用rand()函數獲取一個隨機數
如果你只要產生隨機數而不需要設定范圍的話,你只要用rand()就可以了:rand()會返回一隨機數值, 范圍在0至RAND_MAX 間。RAND_MAX定義在stdlib.h, 其值為2147483647。

使用rand函數和time函數
我們上面已經可以獲取隨機數了,為什么還需要使用time函數呢?我們通過多次運行發現,該程序雖然生成了10個隨機數,但是這個10個隨機數是固定的,也就是說並不隨着時間的變化而變化。

這與srand()函數有關。srand()用來設置rand()產生隨機數時的隨機數種子。在調用rand()函數產生隨機數前,必須先利用srand()設好隨機數種子(seed), 如果未設隨機數種子, rand()在調用時會自動設隨機數種子為1。

上面的例子就是因為沒有設置隨機數種子,每次隨機數種子都自動設成相同值1 ,進而導致rand()所產生的隨機數值都一樣。

srand()函數定義 : void srand (unsigned int seed);

通常可以利用geypid()或time(0)的返回值來當做seed

如果你用time(0)的話,要加入頭文件#include<ctime>

time(0)或者time(NULL)返回的是系統的時間(從1970.1.1午夜算起),單位:秒


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM