在python數據分析的學習和應用過程中,經常需要用到numpy的隨機函數,由於隨機函數random的功能比較多,經常會混淆或記不住,下面進行匯總並一一實例學習。
第一篇總結簡單的隨機數據庫的生產,主要常用的函數有np.random.rand()、.randint()、.randn()、.random()等.
1、np.random.rand(d0, d1, …, dn)
- 根據給定維度生成[0,1)之間的數據,包含0,不包含1
- dn表格每個維度
- 返回值為指定維度的array
2、randn(d0, d1, …, dn)返回一個樣本,具有標准正態分布。
-
randn函數返回一個或一組樣本,具有標准正態分布。
-
dn表格每個維度
-
返回值為指定維度的array
標准正態分布介紹:標准正態分布—-standard normal distribution;標准正態分布又稱為u分布,是以0為均值、以1為標准差的正態分布,記為N(0,1)。
3、randint(low[, high, size])
-
返回隨機整數,范圍區間為[low,high),包含low,不包含high
-
參數:low為最小值,high為最大值,size為數組維度大小,dtype為數據類型,預科是什么默認的數據類型是np.int
-
high沒有填寫時,默認生成隨機數的范圍是[0,low)
4、np.random.random([size])生成[0,1)之間的浮點數,與np.random.random()功能類似
- numpy.random.random_sample(size=None)
- numpy.random.ranf(size=None)
- numpy.random.sample(size=None)
上述三個函數同樣具有類似的功能:
5、numpy.random.choice(a[, size, replace, p])生成一個隨機樣本,從一個給定的一維數組
- 從給定的一維數組中生成隨機數
- 參數: a為一維數組類似數據或整數;size為數組維度;p為數組中的數據出現的概率
- a為整數時,對應的一維數組為np.arange(a)
6、numpy.random.seed()生成隨機數的種子,使得每次生成隨機數相同
- np.random.seed()的作用:使得隨機數據可預測。
- 當我們設置相同的seed,每次生成的隨機數相同。如果不設置seed,則每次會生成不同的隨機數
