怎么理解np.random.seed()?


在使用numpy時,難免會用到隨機數生成器。我一直對np.random.seed(),隨機數種子搞不懂。很多博客也就粗略的說,利用隨機數種子,每次生成的隨機數相同。

我有兩個疑惑:1, 利用隨機數種子,每次生成的隨機數相同。這是什么意思?

       2,隨機數種子的參數怎么選擇?在別人的代碼中經常看到np.random.seed(Argument),這個參數不一樣,有的是0,有的是1,當然還有其他數。那這個參數應該怎么選擇呢?

通過對別的博客的理解,我做了以下幾組實驗:

1.以np.random.randn()函數為例

import numpy as np

if __name__ == '__main__':
i = 0
while(i<6):
if(i<3):
np.random.seed(0)
print(np.random.randn(1, 5))
else:
print(np.random.randn(1, 5))
pass
i += 1
i = 0
while(i<2):
print(np.random.randn(1, 5))
i += 1
print(np.random.randn(2, 5))
np.random.seed(0)
i = 0
while(i<8):
print(np.random.randn(1, 5))
i += 1

結果:

[[ 1.76405235 0.40015721 0.97873798 2.2408932 1.86755799]]
[[ 1.76405235 0.40015721 0.97873798 2.2408932 1.86755799]]
[[ 1.76405235 0.40015721 0.97873798 2.2408932 1.86755799]]
[[-0.97727788 0.95008842 -0.15135721 -0.10321885 0.4105985 ]]
[[ 0.14404357 1.45427351 0.76103773 0.12167502 0.44386323]]
[[ 0.33367433 1.49407907 -0.20515826 0.3130677 -0.85409574]]
[[-2.55298982 0.6536186 0.8644362 -0.74216502 2.26975462]]
[[-1.45436567 0.04575852 -0.18718385 1.53277921 1.46935877]]
[[ 0.15494743 0.37816252 -0.88778575 -1.98079647 -0.34791215]
[ 0.15634897 1.23029068 1.20237985 -0.38732682 -0.30230275]]

[[ 1.76405235 0.40015721 0.97873798 2.2408932 1.86755799]]
[[-0.97727788 0.95008842 -0.15135721 -0.10321885 0.4105985 ]]
[[ 0.14404357 1.45427351 0.76103773 0.12167502 0.44386323]]
[[ 0.33367433 1.49407907 -0.20515826 0.3130677 -0.85409574]]
[[-2.55298982 0.6536186 0.8644362 -0.74216502 2.26975462]]
[[-1.45436567 0.04575852 -0.18718385 1.53277921 1.46935877]]
[[ 0.15494743 0.37816252 -0.88778575 -1.98079647 -0.34791215]]
[[ 0.15634897 1.23029068 1.20237985 -0.38732682 -0.30230275]]

通過該實驗我們可以得到以下結論:

1.1.可以看出,像http://blog.csdn.net/linzch3/article/details/58220569這篇博客中提到的,np.random.seed()對后面的隨機數一次有效,而不是一直有效,這種說法是錯誤的。

兩次利用隨機數種子后,即便是跳出循環后,生成隨機數的結果依然是相同的。第一次跳出while循環后,進入第二個while循環,得到的兩個隨機數組確實和加了隨機數種子不一樣。但是,后面的加了隨機數種子的,八次循環中的結果和前面的結果是一樣的。說明,隨機數種子對后面的結果一直有影響。同時,加了隨機數種子以后,后面的隨機數組都是按一定的順序生成的。

1.2.在同樣的隨機種子后第六次的隨機數生成結果,(結果高亮部分),兩行五列的數組和兩個一行五列的數組結果相同。說明,在生成多行隨機數組時,是由單行隨機數組組合而成的。

現在我們回答了第一個疑惑:利用隨機數種子,每次生成的隨機數相同。這是什么意思? --就是使后面的隨機數按一定的順序生成。

2.

import numpy as np

if __name__ == '__main__':
    i = 0
    np.random.seed(0)
    while(i<3):
        print(np.random.randn(1, 5))
        i += 1
    i = 0
    np.random.seed(1)
    i = 0
    while(i<3):
        print(np.random.randn(1, 5))
        i += 1
[[ 1.76405235  0.40015721  0.97873798  2.2408932   1.86755799]]
[[-0.97727788  0.95008842 -0.15135721 -0.10321885  0.4105985 ]]
[[ 0.14404357  1.45427351  0.76103773  0.12167502  0.44386323]]
[[
1.62434536 -0.61175641 -0.52817175 -1.07296862 0.86540763]] [[-2.3015387 1.74481176 -0.7612069 0.3190391 -0.24937038]] [[ 1.46210794 -2.06014071 -0.3224172 -0.38405435 1.13376944]]

你可以實驗,在你的電腦上,當隨機數種子參數為0和1時,生成的隨機數和我上面高亮的結果相同。說明該參數指定了一個隨機數生成的起始位置。每個參數對應一個位置。並且在該參數確定后,其后面的隨機數的生成順序也就確定了。

所以,現在我們回答了我的第二個疑問:隨機數種子的參數怎么選擇?我認為隨意,這個參數只是確定一下隨機數的起始位置。

以上只是我的個人見解,如果有不對的地方,請各位指正。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM