1、隨機場(RF)
在概率論中,由樣本空間Ω任意取樣構成的隨機變量X_i的集合S = {X_1,X_2, ..., X_n},對所有的ω∈Ω式子π(ω) > 0均成立,則稱π為一個隨機場。
2、馬爾可夫隨機場(MRF)
當隨機變量具有依賴關系時,我們研究隨機場才有實際的意義,具有馬爾可夫性質的隨機變量X_i的全聯合概率分布模型,構成馬爾可夫隨機場。
馬爾可夫隨機場對應一個無向圖 G = (V, E)。無向圖上的每一個節點v ∈ V對應一個隨機變量y,倆節點構成的邊{u, v} ∈ E 表示節點對應的隨機變量y_u, y_v之間有概率依賴關系 P(y_u|y_v),並且依賴關系服從馬爾可夫性——離當前因素比較遙遠(這個遙遠要根據具體情況自己定義)的因素對當前因素的性質影響不大。因此,MRF的結構本質上反應了我們的先驗知識——哪些變量之間有依賴關系需要考慮,而哪些可以忽略。
這樣我們可以引入團的概念來定義一組具有依賴關系的隨機變量(Y_c)。若無向圖G一個節點集合中任意兩個結點{u,v}均有連接,則該集合稱為團C,若團C不能加入任意節點且同時滿足均有連接的約束,則該團稱為最大團。
那么無向圖上的聯合概率分布P(Y)可寫作圖中所有最大團C上的函數Y_c的乘積形式,即:
其中psai_c(Y_c)稱為勢函數,它的定義為
3、條件隨機場(CRF)
如果給定的MRF中每個隨機變量y下面還有觀察值x,我們要確定的是給定觀察集合X下,這個MRF的分布,也就是條件分布,那么這個MRF就稱為CRF。它的條件分布形式完全類似於MRF的分布形式,只不過多了一個觀察集合X。CRF本質上是給定了觀察值 (observations)集合的MRF。
設G=(V,E)是一個無向圖,是以G中節點v為索引的隨機變量Y_v構成的集合,在給定X 的條件下,如果每個隨機變量Y_v服從馬爾可夫屬性,即
, 則(X,Y)就構成一個條件隨機場。注意,定義中並不要求X和Y具有相同結構
解決序列標注問題我們可以將條件隨機場具體化為線性鏈結構的條件隨機場(Linear-chain CRFs),其中X表示輸入的觀測序列,Y表示對應輸出的狀態序列。
4、形式化
同最大熵模型相似,我們需要先引入特征函數,其中t_k是定義在邊上的轉移特征,依賴於當前位置y_i和前一位置y_{i-1},s_l是定義在節點上的狀態特征,只依賴於當前位置。
我們可以將轉移特征和狀態特征用統一的符號表示,則特征函數f(x,y)的數量等於K+L
那么對於每個團Y_i上的勢函數psai_i(Y_i)有
帶入P(Y|X)與Z(X)最終得到,其中n是隨機序列X的個數
5、與最大熵馬爾可夫模型的比較
對比CRF, MEMM模型公式,可以看出,條件隨機場需要計算全局特征向量歸一化特征函數的參數向量lambda_i,用以解決MEMM中的標記偏置問題,但很明顯這樣也會帶來的巨大的計算量。