常用的概率分布:伯努利分布、二項式分布、多項式分布、先驗概率,后驗概率


一,伯努利分布(bernouli distribution)


又叫做0-1分布,指一次隨機試驗,結果只有兩種。也就是一個隨機變量的取值只有0和1。
記為: 0-1分布 或B(1,p),其中 p 表示一次伯努利實驗中結果為正或為1的概率。 

概率計算:

P(X=0)=p0P(X=1)=p1

期望計算:

E(X)=0p0+1p1=p

最簡單的例子就是,拋一次硬幣,預測結果為正還是反。

 

二,二項式分布(binomial distrubution)


表示n次伯努利實驗的結果。

記為:X~B(n,p),其中n表示實驗次數,p表示每次伯努利實驗的結果為1的概率,X表示n次實驗中成功的次數。
概率計算:

期望計算:

例子就是,求多次拋硬幣,預測結果為正面的次數。

 

三,多項式分布(multinomial distribution)


多項式分布是二項式分布的擴展,不同的是多項式分布中,每次實驗有n種結果。
概率計算:

期望計算:

最簡單的例子就是多次拋篩子,統計各個面被擲中的次數。

 

四,先驗概率,后驗概率,共軛分布


先驗概率和后驗概率 :

  先驗概率和后驗概率的概念是相對的,后驗的概率通常是在先驗概率的基礎上加入新的信息后得到的概率,所以也通常稱為條件概率。比如抽獎活動,5個球中有2個球有獎,現在有五個人去抽,小名排在第三個,問題小明抽到獎的概率是多少?初始時什么都不知道,當然小明抽到獎的概率P( X = 1 ) = 2/5。但當知道第一個人抽到獎后,小明抽到獎的概率就要發生變化,P(X = 1| Y1 = 1) = 1/4。

  再比如自然語言處理中的語言模型,需要計算一個單詞被語言模型產生的概率P(w)。沒有看到任何語料庫的時候,我們只能猜測或者平經驗,或者根據一個文檔中單詞w的占比,來決定單詞的先驗概率P(w) = 1/1000。之后根據獲得的文檔越多,我們可以不斷的更新

。也可以寫成。再比如,你去抓娃娃機,沒抓之前,你也可以估計抓到的概率,大致在1/5到1/50之間,它不可能是1/1000或1/2。然后你可以通過投幣,多次使用娃娃機,更據經驗來修正,你對娃娃機抓到娃娃的概率推斷。后驗概率有時候也可以認為是不斷學習修正得到的更精確,或者更符合當前情況下的概率。

共軛分布 :

  通常我們可以假設先驗概率符合某種規律或者分布,然后根據增加的信息,我們同樣可以得到后驗概率的計算公式或者分布。如果先驗概率和后驗概率的符合相同的分布,那么這種分布叫做共軛分布。共軛分布的好處是可以清晰明了的看到,新增加的信息對分布參數的影響,也即概率分布的變化規律。

 

 

知識點:伯努利分布、二項式分布、多項式分布、先驗概率,后驗概率,共軛分布、貝塔分布、貝塔-二項分布、負二項分布、狄里克雷分布,伽馬函數、分布

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM