概率圖分為有向圖(bayesian network)與無向圖(markov random filed)。在概率圖上可以建立生成模型或判別模型。有向圖多為生成模型,無向圖多為判別模型。
判別模型(Discriminative Model),又可以稱為條件模型,或條件概率模型。估計的是條件概率分布(conditional distribution),p(class|context)。利用正負例和分類標簽,主要關心判別模型的邊緣分布。其目標函數直接對應於分類准確率。 (判別模型多數放在分類)
主要特點:尋找不同類別之間的最優分類面,反映的是異類數據之間的差異。
優點:(1)分類邊界更靈活,比使用純概率方法或生產模型得到的更高級;(2)能清晰的分辨出多類或某一類與其他類之間的差異特征;(3)在聚類、視角變化、部分遮擋、尺度改變等方面效果較好;(4)適用於較多類別的識別;(5)判別模型的性能比生成模型要簡單,比較容易學習。
缺點:(1)不能反映訓練數據本身的特性,即能力有限,可以告訴你的是1還是2,但沒有辦法把整個場景描述出來;(2)缺少生成模型的優點,即先驗結構的不確定性;(3)黑盒操作,即變量間的關系不清楚,不可視。
常見的主要有:logistic regression、SVMs、traditional neural networks、Nearest neighbor、Conditional random fields。
主要應用:Image and document classification、Biosequence analysis、Time series prediction。
優點:(1)實際上帶的信息要比判別模型豐富;(2)研究單類問題比判別模型靈活性強;(3)模型可以通過增量學習得到;(4)能用於數據不完整(missing data)情況;(5)很容易將先驗知識考慮進去。
缺點:(1)容易會產生錯誤分類;(2)學習和計算過程比較復雜。
常見的主要有:Gaussians、Naive Bayes、Mixtures of multinomials、Mixtures of Gaussians、Mixtures of experts、HMMs、Sigmoidal belief networks、Bayesian networks、Markov random fields。
主要應用:(1)傳統基於規則的或布爾邏輯系統正被統計方法所代替;(2)醫學診斷。
注:所列舉的生成模型也可以用判決模型的方法來訓練,比如GMM或HMM,訓練的方法有EBW(Extended Baum Welch),或最近Fei Sha提出的Large Margin方法。