機器學習 —— 概率圖模型(推理:MAP)


  MAP 是最大后驗概率的縮寫。后驗概率指的是當有一定觀測結果的情況下,對其他隨機變量進行推理。假設隨機變量的集合為X ,觀察到的變量為 e, W = X-e , AP = P(W|e). 后驗概率和聯合概率是不同的兩個概念。事實上,后驗概率更接近推理本身的“意義”,並且被越來越多的用於診斷系統中。在醫療診斷系統中,存在包括病症,症狀等許多隨機變量,使用VE或者消息傳遞之類的推理手段確實可以獲得每個隨機變量的概率以及某些隨機變量的聯合概率(一個Scope的概率)。但實際上,如果面對某些很少出現的症狀以及對應病症,聯合概率密度函數並不合適,比如病人紅細胞減少的概率非常小,但紅細胞減少很大幾率上對應“白血病”。如果求聯合分布則會得到一個較小的概率值(因為得白血病的人本來就不多,加上有其他症狀干擾),但是如果使用后驗概率,則能排除此干擾。

1. 積化和的最大化  

  最大后驗概率是一種推理手段。w = argmax P(W|e)。 W是尚未觀測到的隨機變量,使得此概率最大的意義是在獲得某觀測后,推斷最可能發生了什么。這個公式把MAP變成了一個優化問題。P(X)實際上是一系列 P(scope)的乘積。在取對數的情況下,積就變成了和,對數的底是可以隨意選擇的。demo example 如下圖所示.

  如果 PHI_k (Dk) 是鏈狀分解的情況下,可以采用變量分離最大化的方式來求取其最大值。如圖所示:

  由變量邊際類比可知,還可由消息傳遞的方式來計算最終結果。實際上這里的最大值代替了邊際。利用消息傳遞的方式計算最大后驗概率如圖所示:

  最大化執行完畢后,得到的是各個變量的“勢”,以及使得“勢”最大的變量組合取值。簡而言之,就是一組推斷的結果。

 

2. NP完備的MAP問題

2.1 對應問題

  對應問題是在工程中經常碰到的問題。例如多目視覺中的配准,同一個物體被不同像素觀測到。那么我們關心的兩個不同的像素值各是多少。這個像素值本質是隨機變量,物體是觀測量。該問題可以直觀的表示為下圖:

  

2.2 聯系勢能與最小割

  聯系勢能往往用於一種特殊的MRF中,例如 pair wise MRF(成對的馬爾科夫網絡)。這種網絡有一個特點就是隨機變量之間兩兩相連,隨機變量(用於圖像分割問題則是label,三維重構中則是深度)可以分為兩個部分,第一是圖的頂點,也就是圖片的像素,第二是圖的邊,也就是兩個相連像素的鄰接關系(xixj)。pair wise 馬爾科夫場就是這樣定義變量scope的,原因不明。

  針對相鄰的兩個變量,可以定義Phi_(xi,xj)為聯系勢能,其表述如下圖所示。

  其中,a+d>b+c表示相鄰的兩個像素應該相近。此外再利用罰函數防止邊緣誤判。最后通過最小割算法對連接勢能進行分割則可達成圖像分割的目的。

2.3 基數因子,離散因子

  因子法比較簡單粗暴,直接對某種隨機變量的特定組合,一般是scope的組合,定義一個因子,希望可能發生的就把因子定義的盡可能大。其中基數因子利用直接統計隨機變量取值的方式,如相鄰4像素均為藍色,則label可能是天空的概率就極高。

  離散因子法是針對某些特定組合定義較高的勢能,而其他組合則給較低的勢能,這種勢能定義方法往往用於輸入判斷。如果輸入某個拼音組合和字典中的某個詞對應,則提示改詞。

2.4 凸因子

  凸因子是在一串隨機變量中給出一個凸緊集的方式,本質上是強化目標的連續性。例如圖像分割問題中,相鄰像素的label極大可能是相同的。以此為約束可提高運算速度。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM