隱馬爾可夫模型(Hidden Markov Model,HMM)是可用於標注問題的統計學習模型,描述由隱藏的馬爾可夫鏈隨機生成觀測序列的過程,屬於生成模型。HMM在語音識別、自然語言處理、生物信息、模式識別等領域都有着廣泛的應用。
一、 HMM模型的定義
HMM模型是關於時序的概率模型,描述由一個隱藏的馬爾可夫鏈隨機生成不可觀測的狀態隨機序列,再由各個狀態生成一個觀測而產生觀測隨機序列的過程。隱藏的馬爾可夫鏈隨機生成的狀態的序列稱為狀態序列(state sequence);每個狀態生成一個觀測,再由此產生的觀測的隨機序列,稱為觀測序列(observation sequence。序列的每一個位置可以看作是一個時刻。
HMM模型由初始概率分布、狀態轉移概率分布、觀測概率分布確定。設$Q$是所有可能的狀態的集合,$V$是所有可能的觀測的集合,即:
$Q=\left\{q_{1}, q_{2}, \cdots, q_{N}\right\}, \quad V=\left\{v_{1}, v_{2}, \cdots, v_{M}\right\}$
其中,$N$是可能的狀態數,$M$是可能的觀測數。記$I$是長度為$T$的狀態序列,$O$是對應的觀測序列,即:
$I=\left(i_{1}, i_{2}, \cdots, i_{T}\right), \quad O=\left(o_{1}, o_{2}, \cdots, o_{T}\right)$
