HMM 前向后向算法（轉）

本文轉載自查看原文 2017-01-14 16:30 14040 Nlp

最近研究NLP頗感興趣，但由於比較懶，所以只好找來網上別人的比較好的博客，備份一下，也方便自己以后方便查找（其實，一般是不會再回過頭來看的，嘿嘿 -_-!!)

代碼自己重新寫了一遍，所以就不把原文代碼貼過來了。

1. 前向算法（摘自http://www.cnblogs.com/kaituorensheng/archive/2012/12/01/2797230.html）

隱馬模型的評估問題即，在已知一個觀察序列O=O₁O₂...O_T，和模型μ=（A,B,π}的條件下，觀察序列O的概率，即P(O|μ}

如果窮盡所有的狀態組合，即S₁S₁...S₁, S₁S₁...S₂, S₁S₁...S₃, ..., S₃S₃...S₃。這樣的話t₁時刻有N個狀態，t₂時刻有N個狀態...t_T時刻有N個狀態，這樣的話一共有N*N*...*N= N^T種組合，時間復雜度為O(N^T),計算時，就會出現“指數爆炸”，當T很大時，簡直無法計算這個值。為解決這一問題，Baum提出了前向算法。

歸納過程

首先引入前向變量α_t(i):在時間t時刻，HMM輸出序列為O₁O₂...O_T,在第t時刻位於狀態s_i的概率。

當T=1時，輸出序列為O₁,此時計算概率為P(O₁|μ）：假設有三個狀態（如下圖）1、2、3，輸出序列為O₁，有三種可能一是狀態1發出，二是從狀態2發出，三是從狀態3發出。另外從狀態1發出觀察值O₁得概率為b₁(O₁),從狀態2發出觀察值O₁得概率為b₂(O₁),從狀態3發出觀察值O₁得概率為b₃(O₁)。因此可以算出

P(O₁|μ）= π₁*b₁(O₁)+π₂*b₂(O₁) + π₃*b₃(O₁)= α₁(1) + α₁(2) + α₁(3)

當T=2時，輸出序列為O₁O₂,此時計算概率為P(O₁O₂|μ）：假設有三個狀態（如下圖）1、2、3，輸出序列為O₁，有三種可能一是狀態1發出，二是從狀態2發出，三是從狀態3發出。另外從狀態1發出觀察值O₂得概率為b₁(O₂),從狀態2發出觀察值O₂得概率為b₂(O₂),從狀態3發出觀察值O₂得概率為b₃(O₂)。

要是從狀態1發出觀察值O₂，可能從第一時刻的1、2或3狀態裝換過來，要是從狀態1轉換過來，概率為α₁(1)*a₁₁*b₁(O₂),要是從狀態2轉換過來，概率為α₁(2)*a₂₁*b₁(O₂),要是從狀態3轉換過來，概率為α₁(3)*a₃₁*b₁(O₂),因此

P(O₁O_₂,q₂₌s₁|μ）= α₁(1)*a₁₁*b₁(O₂) + α₁(2)*a₂₁*b₁(O₂) + α₁(3)*a₃₁*b₁(O₂)=α₂(1)

同理：P(O₁O_₂_,q₂₌s₁|μ）= α₁(1)*a₁₂*b₂(O₂) + α₁(2)*a₂₂*b₂(O₂) + α₁(3)*a₃₂*b₂(O₂)=α₂(2)

P(O₁O_₂_,q₂₌s₁|μ）= α₁(1)*a₁₃*b₁(O₂) + α₁(2)*a₂₃*b₃(O₂) + α₁(3)*a₃₃*b₃(O₂)=α₂(3)

所以：P(O₁O_₂|μ）=P(O₁O_₂,q₂₌s₁|μ）+ P(O₁O_₂_,q₂₌s₁|μ）+ P(O₁O_₂_,q₂₌s₁|μ）

=α₂(1) + α₂(2) + α₂(3)

以此類推。。。

前向算法

step1 初始化：α₁(i) = π_i*b_i(O₁), 1≤i≤N

step2 歸納計算:

step3 終結：

P(O|μ）=

時間復雜度

計算某時刻的某個狀態的前向變量需要看前一時刻的N個狀態，此時時間復雜度為O(N),每個時刻有N個狀態，此時時間復雜度為N*O(N)=O(N²),又有T個時刻，所以時間復雜度為T*O(N²)=O(N²T)。

程序例證

前向算法計算P(O|M)：

step1：α₁(1) =π₁*b₁(red)=0.2*0.5=0.1 α₁(2)=π₂*b₂(red)==0.4*0.4= 0.16 α₁(3)=π₃*b₃(red)==0.4*0.7=0.21

step2：α₂(1)=α₁(1)*a₁₁*b₁(white) + α₁(2)*a₂₁*b₁(white) + α₁(3)*a₃₁*b₁(white)

...

step3:P(O|M) = α₃(1)+α₃(2)+α₃(3)

2. 后向算法(摘自http://www.cnblogs.com/kaituorensheng/archive/2012/12/03/2800489.html)

對於HMM的評估問題，利用動態規划可以用前向算法，從前到后算出前向變量；也可以采用后向算法，從后到前算出后向變量。

先介紹后向變量β_t(i):給定模型μ=（A,B,π），並且在時間 時刻t 狀態為s_i的前提下，輸出序列為O_t+1O_t+2...O_T的概率，即

β_t(i)=P(O_t+1O_t+2...O_T|q_t=s_i,μ)

歸納過程

假設仍然有3個狀態

當t=T時，按照定義：時間t 狀態q_T輸出為O_T+1......的概率，從T+1開始的輸出是不存在的（因為T時刻是終止終止狀態），即T之后是空，是個必然事件，因此β_t(i)=1,1≤1≤N

當t=T-1時，

β_T-1(i)=P(O_T|q_T-1=s_i,μ) = a_i1*b₁（O_T)*β_T(1) + a_i2*b₂（O_T)*β_T(2) + a_i3*b₃（O_T)*β_T(3)

......

當t=1時，

β₁(1)=P(O₂O_3...O_T|q₂=s₁,μ) = a₁₁*b₁（O₂)*β₂(1) + a₁₂*b₂（O₂)*β₂(2) + a₁₃*b₃（O₂)*β₂(3)

β₁(2)=P(O₂O_3...O_T|q₂=s₁,μ) = a₂₁*b₁（O₂)*β₂(1) + a₂₂*b₂（O₂)*β₂(2) + a₂₃*b₃（O₂)*β₂(3)

β₁(3)=P(O₂O_3...O_T|q₂=s₁,μ) = a₃₁*b₁（O₂)*β₂(1) + a₃₂*b₂（O₂)*β₂(2) + a₃₃*b₃（O₂)*β₂(3)

P(O₁O₂...O_T|μ) =

后向算法

step1 初始化：β_T(i)=1, 1≤1≤N

step2 歸納計算：

1≤t≤T-1, 1≤i≤N

step3 求終結和：

P(O|μ）=

時間復雜度

計算某時刻在某個狀態下的后向變量需要看后一時刻的N個狀態，此時時間復雜度為O(N),每個時刻有N個狀態，此時時間復雜度為N*O(N)=O(N²),又有T個時刻，所以時間復雜度為T*O(N²)=O(N²T)。

程序例證

后向算法

計算P(O|M)：

step1：β₄(1) = 1 β₄(2) = 1 β₄(3) = 1

step2：β₃(1) = β₄(1)*a₁₁*b₁(white) + β₄(2)*a₁₂*b₂(white) + β₄(3)*a₁₃*b₃(white)

...

step3:P(O|M) = π₁*β₁(1)*b₁(O₁) + π₂*β₁(2)*b₂(O₁) + π₃*β₁(3)*b₃(O₁)

3.前向-后向算法(摘自http://www.cnblogs.com/kaituorensheng/archive/2012/12/05/2803182.html)

重新回顧：

前向變量α_t(i):在時刻t,在已知模型μ=（A,B,π）的條件下，狀態處於s_i,輸出序列為O₁0₂...O_t,前向變量為α_t(i)

后向變量β_t(i):在時刻t,在已知模型μ=（A,B,π）和狀態處於s_i的條件下，輸出序列為O_t+1O_t+2...O_T,后向變量為β_t(i)

公式推導：

P(O,q_t=s_i|μ） = P(O₁O₂...O_T, q_t=s_i|μ）

=P(O₁O₂...O_t,q_t=si,O_t+1O_t+2...O_T|μ)

=P(O₁O₂...O_t,q_t=si|μ) * P(O_t+1O_t+2...O_T|O₁O₂...O_t,q_t=si,μ)

=P(O₁O₂...O_t,q_t=si|μ) * P(O_t+1O_t+2...O_T|q_t=si,μ)

=α_t(i) * β_t(i)

P(O|μ）=

案例分析：

分析：

P(q₄=s₃|O,M) = P(q₄=s₃, O|M)/P(O|M)

= P(O,q₄=s₃|M)/P(O|M)

= α₄(3) * β₄(3)/

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 HMM-前向后向算法理解與實現（python）隱馬爾可夫(HMM)、前/后向算法、Viterbi算法神經網絡中的前向后向傳播算法隱馬爾可夫模型（七）——隱馬爾可夫模型的學習問題(前向后向算法）條件隨機場CRF(二) 前向后向算法評估標記序列概率最大匹配算法進行分詞前向后向 python實現前向散射光與后向散射光后向傳播算法“backpropragation”詳解 HMM模型和Viterbi算法神經網絡之后向傳播算法