概率圖基礎：概率基本概念、條件獨立性、圖求解聯合概率的規則合理性推理

本文轉載自查看原文 2020-07-04 10:58 864 機器學習

來源：B站up主Shuhuai008：板書

概率圖框架：

概率圖可分為有向（Bayes Network）和無向（Markov Netwrok），其中從（隨機變量服從離散或者連續概率分布）的分類角度可分為高斯圖（連續）和其他（離散）。

概率基本概念：

Bayes是一個概率的概念，可從基本的規則推導而來。

邊緣概率：p(xi);

條件概率：p(xj | xi);

聯合概率：p(x1,x2);

基本規則有如下兩個規則：

sum規則：p(x1)=∫p(x1,x2)dx2 【涉及聯合概率；邊緣概率】

Product規則：p(x1,x2)=p(x1)p(x2|x1)=p(x2)p(x2|x1); 【涉及條件概率；邊緣概率】

Chain規則：

p(x1,x2,x3)=p(x1)p(x2|x1)p(x3|x1,x2);

p(x1,x2,…xi)=product_(i=1~p)(p(xi|x1,x2,x_i-1)); （1）

Bayes規則：p(x2|x1)=p(x1,x2)/p(x1)=p(x1,x2)/∫p(x1,x2)dx2=p(x2)p(x1|x2)/∫p(x1,x2)dx2

概率模型求解問題時存在的高維困局：

用概率模型解決問題的時候，求解聯合概率是關鍵的一步，但由於求解復雜問題時，往往隨機變量均為高維數據，從chain公式的推導可以看出每一個隨機變量的計算，都與它之前的隨機變量有關，運算量非常大，那么就存在一個高維困境的問題，這個問題可以通過以下方法解決。

高維困局解決方法（Naive Bayes; Markov;條件獨立性）：

首先分析得出，由於隨機變量間的條件概率計算繁瑣，那么可以假設所有隨機變量均為相互獨立的變量，達到簡化計算的目的，這就是朴素Bayes的思想，那么p(x1,x2,…xi)=product_(i=1~p)(p(xi));。但是這個假設假設得太“過”了，計算出的結果與實際相差甚遠，那么就需要想出折中的辦法，由此引出了Markov假設（這里只介紹一階Markov假設）：xj⊥x_i+1 | xi，j<I，在當前狀態xi可以被觀測的情況下，過去狀態xj與未來狀態x_i+1條件獨立。【一階Markov假設：因為隱狀態是一階的所以叫一階Markov假設？】

markov性質示意圖（一階馬氏鏈）

但是Markov假設還是太理想了，所以將其進行推廣，得到了條件獨立性的假設。在條件獨立性中，假設xi分別與一定數量的其他變量相關（需要計算條件概率），而與剩下的變量相互獨立，這就引出了“條件獨立性”的概念。條件獨立性可以用符號表示，a⊥b|c：表示已知c的情況下，a和b相互獨立；或者說在c可以被觀測的情況下，a和b相互獨立。條件獨立性是采用chain規則求解聯合概率的一種簡化手段，為了解決高維困境，較少計算時間提出的。

（2）

引入條件獨立性求解聯合概率的公式【xpa是“圖”中xi父節點的集合】（也可稱為聯合概率的因子分解形式）

既然條件獨立性提出了，那么概率的定義、相關規則、求解手段都具備了。那么現在來說說“概率圖”中的“圖”。

概率圖求解聯合概率：

1、解決問題步驟：分析問題=>得出各個狀態變量的拓撲排序（父節點/子節點）=>畫出概率圖=>列出聯合概率式子

2、概率圖圖標、符號解釋：

其中，空心圓圈表示狀態變量，實心圓圈表示可以被觀測到的變量。【由於變量是否可被觀測對條件獨立性有影響，所以概率“圖”中有這樣的區分。】，箭頭表示狀態變量間的關系，在有向圖中，箭頭表示拓撲關系：p(a);p(b|a)：a是父節點，b是子節點，箭頭從父結點指向子節點。

下面介紹怎么用圖表示概率、表示條件獨立性（由於圖是輔助表達的一種手段，所以從圖中是一定能比較簡便的得到某些信息的，使某些信息更加直觀，這也是引入圖的目的。在概率圖中這個“直觀的信息”就是“條件獨立性”）。

能夠直接用概率圖的方法得到聯合概率的合理性可從下面①例子解釋，①②③分別為Bayes網絡的小模塊及其條件獨立性判斷規律（該規律根據邏輯推理總結得到）。

①(tail to tail): b⊥c | a；

若a沒被觀測，則b與c連通，條件不獨立；

若a被觀測，則b與c被阻塞，條件獨立。

【圖中陰影表示狀態變量被觀測】

圖求解規則合理性檢驗：

【【

：通過驗證（1）式和（2）式得出的結果一致，驗證概率圖求解聯合概率的方式可行性。

（1）: p(a,b,c) = p(a)p(b|a)p(c|a,b)

（2）: p(a,b,c) = p(a)p(b|a)p(c|a)

=> 所以要驗證 p(c|a,b)=p(c|a)

=> 兩邊同乘 p(b|a)得

=> p(c|a,b)p(b|a)=p(c|a)p(b|a) 【左邊將a遮掉則較好理解，可看成 p(c|b)p(b)=>p(c,b)】

=> p(c,b|a)=p(c|a)p(b|a)

得證： b⊥c | a

】】

②(tail to head): a⊥c | b

若b沒被觀測，則a與c連通，條件不獨立；

若b被觀測，則a與c阻塞，條件獨立；【<=> p(a,c|b)=p(a|b)p(c|b)】】

【【

圖求解規則合理性檢驗：

（1）: p(a,b,c) = p(a)p(b|a)p(c|a,b)

（2）: p(a,b,c) = p(a)p(b|a)p(c|b)

=> 所以要驗證 p(c|a,b)=p(c|b)

=> 兩邊同乘 p(a|b)得

=> p(c|a,b)p(a|b)=p(c|b)p(a|b) 【左邊將a遮掉則較好理解，可看成 p(c|b)p(b)=>p(c,b)】

=> p(c,a|b)=p(c|abp(a|b)

得證： b⊥c | a

】】

③(head to head): a⊥b

若c沒被觀測，則a與b阻塞，條件獨立；【a⊥b】

若c被觀測，則a與b連通，條件不獨立；

【若d被觀測，則a與b連通，條件不獨立；】

【【

圖求解規則合理性檢驗：

（1）: p(a,b,c) = p(a)p(b|a)p(c|a,b)

（2）: p(a,b,c) = p(a)p(b)p(c|a,b)

=> 所以要驗證 p(b|a)=p(b)

=> 兩邊同乘 p(a)得

=> p(b|a)p(a)=p(b)p(a) 【左邊將a遮掉則較好理解，可看成 p(c|b)p(b)=>p(c,b)】

=> p(a,b)=p(b)p(a)

得證： a⊥b

】】

問題：

一階Markov假設的一階體現在哪兒？狀態變量為一階？變量一階體現在？

混合模型的混合體現在哪兒？體現在有可觀測變量和隱變量么？

完備數據是什么？非隱變量模型？

Bayes 用途？用於分類？

什么是概率圖的連通，指的是狀態變量的概率之間會相互影響？

參考資料：https://www.bilibili.com/video/BV1BW41117xo?p=1 ，作者：shuhuai008

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 《概率統計》1.理論基石：條件概率、獨立性與貝葉斯概率中的相關性與獨立性獨立性測試什么是設備獨立性，引入這一概念有什么好處？模塊獨立性准則獨立性檢驗宋浩《概率論與數理統計》筆記---1.5.1、事件的獨立性如何保證數據庫結構的合理性(一、調整字段) 聯合概率、邊緣概率、條件概率統計獨立性和統計相關性