這個文章的目的是為了加強對這幾個概念的理解與記憶。
怕自己不知道什么時候又忘了。
看自己寫的東西總應該好理解記憶一些吧。
聯合概率的乘法公式:
(當隨機變量x,y獨立,則)
這太簡單了是吧。。。。
聯合概率公式變個形,得到條件概率公式為:
,
全概率公式:
,其中
可以這樣理解把一個圓看成x,其中被划分為好多種情況,對每一種情況的概率求和就是全概率(整個概率)。
(,則
可輕易推導出上式)
貝葉斯公式:
又名后驗概率公式、逆概率公式。
后驗概率=似然函數
*先驗概率
/證據因子
。(是對上式最后一個等號的內容解釋的)
舉個例子。
假設我們根據“是否陰天”這個隨機變量x(取值為“陰天”或“不陰天”)的觀測樣本數據,來判斷是否會下雨(假設總共只有這兩種類別下雨,不下雨)。我們根據經驗來判斷,比如根據歷史數據估,陰天有70%會下雨,也就是說無須觀測樣本數據就知道下雨的先驗概率(Prior Probability)較大。
接着,我們得到了的觀測樣本數據:“下雨”表現為陰天的 條件概率(或者說這種“可能性”即似然(Likelihood))相比於”不下雨“表現為“陰天”的似然
較大。
所以經這次觀測之后加強了我們的判斷:下雨的后驗概率(Posterior Probability)變得比先驗概率
更大,超過了之前的70%!
反之,則會減弱我們的判斷,下雨的后驗概率將小於70%。
因此,后驗概率包含了先驗信息以及觀測樣本數據提供的后驗信息,對先驗概率進行了修正,更接近真實情況。
此外,證據因子(Evidence,也被稱為歸一化常數)可僅看成一個權值因子,以保證各類別的后驗概率總和為1從而滿足概率條件。
如果我們的目標僅僅是要對所屬類別做出一個判別:是“下雨”還是“不下雨”,則無須去計算后驗概率的具體數值,只需計算哪個類別的后驗概率更大即可。假設下雨和不下雨出現的先驗概率相等,則此時類別的判定完全取決於似然和的大小。因此,似然函數(Likelihood,“可能性”)的重要性不是它的具體取值,而是當參數(如類別參數)變化時,函數到底變小還是變大,以便反過來對參數進行估計求解(估計出是還是)。