如何理解先驗概率與后驗概率和似然函數


先驗概率:即一開始由統計得到的客觀概率

后驗概率:由數據樣本和先驗概率推測得到的概率

舉個例子:

玩英雄聯盟占到中國總人口的60%,不玩英雄聯盟的人數占到40%:

為了便於數學敘述,這里我們用變量X來表示取值情況,根據概率的定義以及加法原則,我們可以寫出如下表達式:

P(X=玩lol)=0.6;P(X=不玩lol)=0.4,這個概率是統計得到的,即X的概率分布已知,我們稱其為先驗概率(prior probability);

另外玩lol中80%是男性,20%是小姐姐,不玩lol中20%是男性,80%是小姐姐,這里我用離散變量Y表示性別取值,同時寫出相應的條件概率分布:

 

P(Y=男性|X=玩lol)=0.8,P(Y=小姐姐|X=玩lol)=0.2

P(Y=男性|X=不玩lol)=0.2,P(Y=小姐姐|X=不玩lol)=0.8

那么我想問在已知玩家為男性的情況下,他是lol玩家的概率是多少:

依據貝葉斯准則可得:

P(X=玩lol|Y=男性)=P(Y=男性|X=玩lol)*P(X=玩lol)/

[ P(Y=男性|X=玩lol)*P(X=玩lol)+P(Y=男性|X=不玩lol)*P(X=不玩lol)]

 

最后算出的P(X=玩lol|Y=男性)稱之為X的后驗概率,即它獲得是在觀察到事件Y發生后得到的

如何理解似然函數

這個是quora上的一個回答 What is the difference between probability and likelihood?

在評論中這位老師將概率密度函數和似然函數之間的關系,類比成 [公式][公式] 之間的關系。詳細翻譯如下:

2我們可以做一個類比,假設一個函數為 [公式] ,這個函數包含兩個變量。

如果你令b=2,這樣你就得到了一個關於a的二次函數,即 [公式]

 

當你令a=2時,你將得到一個關於b的指數函數,即 [公式]

 

可以看到這兩個函數有着不同的名字,卻源於同一個函數。

而p(x|θ)也是一個有着兩個變量的函數。如果,你將θ設為常量,則你會得到一個概率函數(關於x的函數);如果,你將x設為常量你將得到似然函數(關於θ的函數)

下面舉一個例子:

有一個硬幣,它有θ的概率會正面向上,有1-θ的概率反面向上。θ是存在的,但是你不知道它是多少。為了獲得θ的值,你做了一個實驗:將硬幣拋10次,得到了一個正反序列:x=HHTTHTHHHH。

無論θ的值是多少,這個序列的概率值為 θ⋅θ⋅(1-θ)⋅(1-θ)⋅θ⋅(1-θ)⋅θ⋅θ⋅θ⋅θ = θ⁷ (1-θ)³

比如,如果θ值為0,則得到這個序列的概率值為0。如果θ值為1/2,概率值為1/1024。

但是,我們應該得到一個更大的概率值,所以我們嘗試了所有θ可取的值,畫出了下圖:

 

這個曲線就是θ的似然函數,通過了解在某一假設下,已知數據發生的可能性,來評價哪一個假設更接近θ的真實值。

如圖所示,最有可能的假設是在θ=0.7的時候取到。但是,你無須得出最終的結論θ=0.7。事實上,根據貝葉斯法則,0.7是一個不太可能的取值(如果你知道幾乎所有的硬幣都是均質的,那么這個實驗並沒有提供足夠的證據來說服你,它是均質的)。但是,0.7卻是最大似然估計的取值。

因為這里僅僅試驗了一次,得到的樣本太少,所以最終求出的最大似然值偏差較大,如果經過多次試驗,擴充樣本空間,則最終求得的最大似然估計將接近真實值0.5。在這篇博客中有詳細的過程,就不再贅述。

參考鏈接:

https://zhuanlan.zhihu.com/p/26464206

https://www.zhihu.com/question/54082000/answer/470252492


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM