概率圖基礎:概率基本概念、條件獨立性、圖求解聯合概率的規則合理性推理


                                           來源:B站up主Shuhuai008:板書

概率圖框架:

概率圖可分為有向(Bayes Network)和無向(Markov Netwrok),其中從(隨機變量服從離散或者連續概率分布)的分類角度可分為高斯圖(連續)和其他(離散)。

概率基本概念:

Bayes是一個概率的概念,可從基本的規則推導而來。

邊緣概率:p(xi);

條件概率:p(xj | xi);

聯合概率:p(x1,x2);

基本規則有如下兩個規則:

sum規則:p(x1)=∫p(x1,x2)dx2  【涉及聯合概率;邊緣概率】

Product規則:p(x1,x2)=p(x1)p(x2|x1)=p(x2)p(x2|x1);  【涉及條件概率;邊緣概率】

Chain規則:

p(x1,x2,x3)=p(x1)p(x2|x1)p(x3|x1,x2);

p(x1,x2,…xi)=product(i=1~p)(p(xi|x1,x2,xi-1));         (1)

Bayes規則:p(x2|x1)=p(x1,x2)/p(x1)=p(x1,x2)/∫p(x1,x2)dx2=p(x2)p(x1|x2)/∫p(x1,x2)dx2

概率模型求解問題時存在的高維困局:

用概率模型解決問題的時候,求解聯合概率是關鍵的一步,但由於求解復雜問題時,往往隨機變量均為高維數據,從chain公式的推導可以看出每一個隨機變量的計算,都與它之前的隨機變量有關,運算量非常大,那么就存在一個高維困境的問題,這個問題可以通過以下方法解決。

高維困局解決方法(Naive Bayes; Markov;條件獨立性):

首先分析得出,由於隨機變量間的條件概率計算繁瑣,那么可以假設所有隨機變量均為相互獨立的變量,達到簡化計算的目的,這就是朴素Bayes的思想,那么p(x1,x2,…xi)=product(i=1~p)(p(xi));。但是這個假設假設得太“過”了,計算出的結果與實際相差甚遠,那么就需要想出折中的辦法,由此引出了Markov假設(這里只介紹一階Markov假設):xj⊥xi+1 | xi,j<I,在當前狀態xi可以被觀測的情況下,過去狀態xj與未來狀態xi+1條件獨立。【一階Markov假設:因為隱狀態是一階的所以叫一階Markov假設?】

                                  markov性質示意圖(一階馬氏鏈)

但是Markov假設還是太理想了,所以將其進行推廣,得到了條件獨立性的假設。在條件獨立性中,假設xi分別與一定數量的其他變量相關(需要計算條件概率),而與剩下的變量相互獨立,這就引出了“條件獨立性”的概念。條件獨立性可以用符號表示,a⊥b|c:表示已知c的情況下,a和b相互獨立;或者說在c可以被觀測的情況下,a和b相互獨立。條件獨立性是采用chain規則求解聯合概率的一種簡化手段,為了解決高維困境,較少計算時間提出的。

     (2)

           引入條件獨立性求解聯合概率的公式【xpa是“圖”中xi父節點的集合】(也可稱為聯合概率的因子分解形式)

既然條件獨立性提出了,那么概率的定義、相關規則、求解手段都具備了。那么現在來說說“概率圖”中的“圖”。

概率圖求解聯合概率:

1、解決問題步驟:分析問題=>得出各個狀態變量的拓撲排序(父節點/子節點)=>畫出概率圖=>列出聯合概率式子

2、概率圖圖標、符號解釋:

其中,空心圓圈表示狀態變量,實心圓圈表示可以被觀測到的變量。【由於變量是否可被觀測對條件獨立性有影響,所以概率“圖”中有這樣的區分。】,箭頭表示狀態變量間的關系,在有向圖中,箭頭表示拓撲關系:p(a);p(b|a):a是父節點,b是子節點,箭頭從父結點指向子節點。

 

下面介紹怎么用圖表示概率、表示條件獨立性(由於圖是輔助表達的一種手段,所以從圖中是一定能比較簡便的得到某些信息的,使某些信息更加直觀,這也是引入圖的目的。在概率圖中這個“直觀的信息”就是“條件獨立性”)。

能夠直接用概率圖的方法得到聯合概率的合理性可從下面①例子解釋,①②③分別為Bayes網絡的小模塊及其條件獨立性判斷規律(該規律根據邏輯推理總結得到)。

①(tail to tail): b⊥c | a;

若a沒被觀測,則b與c連通,條件不獨立;

若a被觀測,則b與c被阻塞,條件獨立。

【圖中陰影表示狀態變量被觀測】

圖求解規則合理性檢驗:

【【

:通過驗證(1)式和(2)式得出的結果一致,驗證概率圖求解聯合概率的方式可行性。

=>

(1): p(a,b,c) = p(a)p(b|a)p(c|a,b)

(2): p(a,b,c) = p(a)p(b|a)p(c|a)

=> 所以要驗證 p(c|a,b)=p(c|a)

=> 兩邊同乘 p(b|a)得

=> p(c|a,b)p(b|a)=p(c|a)p(b|a)  【左邊將a遮掉 則較好理解,可看成 p(c|b)p(b)=>p(c,b)】

=> p(c,b|a)=p(c|a)p(b|a)

得證: b⊥c | a

】】

 

②(tail to head): a⊥c | b

若b沒被觀測,則a與c連通,條件不獨立;

若b被觀測,則a與c阻塞,條件獨立;  【<=> p(a,c|b)=p(a|b)p(c|b)】】

【【

圖求解規則合理性檢驗:

=> 

(1): p(a,b,c) = p(a)p(b|a)p(c|a,b)

(2): p(a,b,c) = p(a)p(b|a)p(c|b)

=> 所以要驗證 p(c|a,b)=p(c|b)    

=> 兩邊同乘 p(a|b)得

=> p(c|a,b)p(a|b)=p(c|b)p(a|b)  【左邊將a遮掉 則較好理解,可看成 p(c|b)p(b)=>p(c,b)】

=> p(c,a|b)=p(c|abp(a|b)

得證: b⊥c | a

】】

 

③(head to head): a⊥b

若c沒被觀測,則a與b阻塞,條件獨立;【a⊥b】

若c被觀測,則a與b連通,條件不獨立;

【若d被觀測,則a與b連通,條件不獨立;】

 

 

 

【【

圖求解規則合理性檢驗:

=>

(1): p(a,b,c) = p(a)p(b|a)p(c|a,b)

(2): p(a,b,c) = p(a)p(b)p(c|a,b)

=> 所以要驗證 p(b|a)=p(b)    

=> 兩邊同乘 p(a)得

=> p(b|a)p(a)=p(b)p(a)  【左邊將a遮掉 則較好理解,可看成 p(c|b)p(b)=>p(c,b)】

=> p(a,b)=p(b)p(a)

得證: a⊥b

】】

 

問題:

一階Markov假設的一階體現在哪兒?狀態變量為一階?變量一階體現在?

混合模型的混合體現在哪兒?體現在有可觀測變量和隱變量么?

完備數據是什么?非隱變量模型?

Bayes 用途?用於分類?

什么是概率圖的連通,指的是狀態變量的概率之間會相互影響?

 

 

 

 

參考資料:https://www.bilibili.com/video/BV1BW41117xo?p=1  ,作者:shuhuai008

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM