先驗概率、似然函數、后驗概率、貝葉斯公式


這個文章的目的是為了加強對這幾個概念的理解與記憶。

怕自己不知道什么時候又忘了。

看自己寫的東西總應該好理解記憶一些吧。

聯合概率的乘法公式:

(當隨機變量x,y獨立,則

這太簡單了是吧。。。。

聯合概率公式變個形,得到條件概率公式為:

全概率公式:

,其中

可以這樣理解把一個圓看成x,其中被划分為好多種情況,對每一種情況的概率求和就是全概率(整個概率)。

 

,則可輕易推導出上式)

貝葉斯公式:

又名后驗概率公式、逆概率公式。

后驗概率=似然函數*先驗概/證據因子。(是對上式最后一個等號的內容解釋的)

舉個例子。

假設我們根據“是否陰天”這個隨機變量x(取值為“陰天”或“不陰天”)的觀測樣本數據,來判斷是否會下雨(假設總共只有這兩種類別下雨,不下雨)。我們根據經驗來判斷,比如根據歷史數據估,陰天有70%會下雨,也就是說無須觀測樣本數據就知道下雨的先驗概率(Prior Probability)較大。

接着,我們得到了的觀測樣本數據:“下雨”表現為陰天的 條件概率或者說這種“可能性”即似然(Likelihood))相比於”不下雨“表現為“陰天”的似然較大。

所以經這次觀測之后加強了我們的判斷:下雨的后驗概率(Posterior Probability)變得比先驗概率更大,超過了之前的70%!

反之,則會減弱我們的判斷,下雨的后驗概率將小於70%。

因此,后驗概率包含了先驗信息以及觀測樣本數據提供的后驗信息,對先驗概率進行了修正,更接近真實情況。

此外,證據因子(Evidence,也被稱為歸一化常數)可僅看成一個權值因子,以保證各類別的后驗概率總和為1從而滿足概率條件。

如果我們的目標僅僅是要對所屬類別做出一個判別:是“下雨”還是“不下雨”,則無須去計算后驗概率的具體數值,只需計算哪個類別的后驗概率更大即可。假設下雨和不下雨出現的先驗概率相等則此時類別的判定完全取決於似然和的大小。因此,似然函數(Likelihood,“可能性”)的重要性不是它的具體取值,而是當參數(如類別參數)變化時,函數到底變小還是變大,以便反過來對參數進行估計求解(估計出是還是)。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM