馬爾可夫隨機場(Markov Random Field,簡稱MRF)是典型的馬爾可夫網,這是一種著名的無向圖模型。圖中每個結點表示一個或一組變量,結點之間的邊表示兩個變量之間的依賴關系。馬爾可夫隨機場有一組勢函數(potential functions),亦稱“因子”(factor),這是定義在變量子集上的非負實函數,主要用於定義概率分布函數。
圖 14.2 一個簡單的馬爾可夫隨機場
圖14.2顯示出一個簡單的馬爾可夫隨機場。對於圖中結點的一個子集,若其中任意兩結點間都有邊連接,則稱該結點子集為一個“團”(clique)。若在一個團中加入另外任何一個結點都不再形成團,則稱該團為“極大團”(maximal clique);換言之,極大團就是不能被其它團所包含的團。例如,在圖14.2中,和
都是團,並且除了
和
之外都是極大團;但是,因為
和
之間缺乏連接,
並不構成團.顯然,每個結點至少出現在一個極大團中.
在馬爾可夫隨機場中,多個變量之間的聯合概率分布能基於團分解為多個因子的乘積,每個因子僅與一個團相關.具體來說,對於個變量
,所有團構成的集合為
,與團
對應的變量集合記為
,則聯合概率分布
定義為
其中為與團
對應的勢函數,用於對團
中的變量關系進行建模,
為規范化因子,以確保
是被正確定義的概率.在實際應用中,精確計算
通常很困難,但許多任務往往並不需獲得
的精確值.
顯然,若變量個數較多,則團的數目將會很多(例如,所有相互連接的兩個變量都會構成團), 這就意味着會有很多乘積項,顯然會給計算帶來負擔.注意到若團
不是極大團,則它必被一個極大團
所包含,即
;這意味着變量
之間的關系不僅體現在勢函數
中,還體現在
中。於是,聯合概率
可基於極大團來定義.假定所有極大團構成的集合為
,則有
其中為規范化因子。例如圖14.2中
,聯合概率分布
定義為
,
其中,勢函數定義在極大團
上,由於它的存在,使我們不再需為團
和
構建勢函數.
在馬爾可夫隨機場中如何得到”條件獨立性”呢?同樣借助“分離”的概念,如圖 14.3所示,若從結點集A中的結點到B中的結點都必須經過結點集C中的結點,則稱結點集A和B被結點集C分離,C稱為“分離集”(separating set).對馬爾可夫隨機場,有
- “全局馬爾可夫性”(global Markov property): 給定兩個變量子集的分離集,則這兩個變量子集條件獨立。
也就是說,圖 14.3中若令A,B和C對應的變量集分別為和
,則
和
在給定
的條件下獨立,記為
.
圖 14.3 結點集A和B被結點集C分離
為便於討論,我們令圖 14.3中的A, B和C分別對應變量和
,於是圖 14.3簡化為圖 14.4.
圖 14.4 圖 14.3的簡化版
對於圖 14.4,可得聯合概率
.
基於條件概率的定義可得……
即和
在給定
時條件獨立。
由全局馬爾可夫性可得到兩個很有用推論:
- 局部馬爾可夫性(local Markov property): 給定某變量的鄰接變量,則該變量條件獨立於其他變量。形式化地說,令
為圖的結點集,
為結點
在圖上的鄰接結點,
,有
.
- 成對馬爾可夫性(pairwise Markov property): 給定所有其他變量,兩個非臨接變量條件獨立。形式化地說,令圖的結點集和邊集分別為
和
,對圖中的兩個結點
和
,若
,則
.
現在我們來考察馬爾可夫隨機場中的勢函數。顯然,勢函數的作用是定量刻畫變量集
中變量之間的相關關系,它應該是非負函數,且在所偏好的變量取值上有較大函數值。例如,假定圖 14.4中的變量均為二值變量,若勢函數為
則說明該模型偏好變量與
擁有相同的取值,
與
擁有不同的取值;換言之,在該模型中
與
正相關,
與
負相關。易知,令
與
相同且
與
不同的變量值指派將取得較高的聯合概率。
為了滿足非負性,指數函數常被用於定義勢函數,即
是一個定義在變量
上的實值函數,常見形式為:
其中和
是參數.上式中的第二項僅考慮單結點,第一項則考慮每一對結點的關系.