一、HMM模型
1.HMM模型的原理?
馬爾科夫假設:當前狀態僅與上一個狀態有關;
觀測獨立性假設: 任意時刻的觀察狀態僅僅依賴於當前時刻的隱藏狀態


圖中Q是狀態序列,O是觀察序列
舉例:詞性標注【我愛美麗的中國】
狀態集合S={名詞N,動詞V,形容詞A}
狀態序列Q={N,V,A}
轉移矩陣aij :
N V A
N 0.1 0.2 0.7
V 0.2 0.7 0.1
A 0.7 0.2 0.1
輸出觀察序列O={N,V,A,N}
求P(O) = P(N)*p(V|N)*P(A|V)*P(N|A)


2.隱狀態是什么含義?
模型的狀態轉換過程是不可觀察的,可觀察事件是狀態的隨機函數。
3.三個基本問題?
概率計算問題:前向算法,后向算法 --> 求觀察序列O的概率
預測問題:維特比算法-->求解最優路徑Q
學習問題:loss函數,最大似然估計-->訓練模型參數,如何調節模型(A,B,u)的參數使得P(O|u)最大化
二、CRF模型
1.CRF模型的原理?
(1)假設滿足馬爾可夫性:當前狀態與前一個和后一個狀態及觀測序列(有線相連的節點)有關,與其他狀態無關;
(2)無觀測獨立性假設;
(3)由於限制更少,CRF利用了更多的信息,如觀測序列上下文信息,以及觀測序列元素本身的特征(是否是數字,是否大寫,是否以某字符串開頭或結尾)


圖中Y是輸出標注狀態序列,X是輸入文本的觀察序列
舉例:詞性標注【我愛美麗的中國】
Y = {N,V,A,N}
X = {我,愛,美麗的,中國}
求條件概率P(Y|X)


t(y,x,i)是轉移函數,表示標注序列Y在i及i-1位置上標記的轉移概率。
s(y,x,i)是狀態函數,表示觀察序列X在i位置的標記概率。
lamda和u分別是各自的權重。
三、綜合比較
(1)HMM與CRF都具有三個基本問題:概率計算問題,預測問題,學習問題
(2)CRF沒有HMM的獨立性假設的嚴格要求,對序列內部信息和外部觀察信息都可以有效利用,避免了標注偏置的問題。
(3)對於概率計算問題,HMM是模擬參數的隨機分布,而CRF是求解問題的特征函數。