Atitit 馬爾可夫過程(Markov process) hmm隱馬爾科夫。 馬爾可夫鏈,的原理attilax總結
1.1. 馬爾科夫的應用 生成一篇“看起來像文章的隨機文本”。1
5. 應用 HMM一開始是在信息論中應用的,后來才被應用到自然語言處理還有其他圖像識別等各個2
6. 擴展數學之美系列十九 -- 馬爾可夫鏈的擴展 貝葉斯網絡 (Bayesian Networks)2
6.1. 馬爾可夫鏈 (MarkovChain), 它描述了一種狀態序列,其每個狀態值取決於前面有限個狀態。3
1. 馬爾可夫過程
馬爾可夫過程(Markov process)是一類隨機過程。它的原始模型馬爾可夫鏈,由俄國數學家A.A.馬爾可夫於1907年提出。該過程具有如下特性:在已知目前狀態 (現在)的條件下,它未來的演變 (將來)不依賴於它以往的演變 ( 過去 ) 。 例如森林中動物頭數的變化構成——馬爾可夫過程 。在現實世界中,有很多過程都是馬爾可夫過程,如液體中微粒所作的布朗運動、傳染病受感染的人數、車站的候車人數等,都可視為馬爾可夫過程
1.1. 馬爾科夫的應用 生成一篇“看起來像文章的隨機文本”。
先稍稍介紹下馬爾可夫鏈,簡單地說就是輸入一篇文章(其實是單詞序列),建立前綴表后綴表,然后根據前綴隨機選擇后綴,如此迭代,生成一篇“看起來像文章的隨機文本”。當然這只是馬爾可夫鏈的一個應用,不過也算挺典型的。我曾經在開發一些應用的時候用類似的程序來生成測試數據。
2. 隱馬爾科夫過程
與馬爾科夫相比,隱馬爾科夫模型則是雙重隨機過程,不僅狀態轉移之間是個隨機事件,狀態和輸出之間也是一個隨機過程,如下圖所示:
3. 隱馬模型基本要素及基本三問題
綜上所述,我們可以得到隱馬爾科夫的基本要素,即一個五元組{S,N,A,B,PI};
S:隱藏狀態集合;
N:觀察狀態集合;
A:隱藏狀態間的轉移概率矩陣;
B:輸出矩陣(即隱藏狀態到輸出狀態的概率);
PI:初始概率分布(隱藏狀態的初始概率分布);
其中,A,B,PI稱為隱馬爾科夫的參數,用X表示。
4. 維特比算法
現在,HMM的第一個基本問題解決了,下面開始解決第二個問題,第二個問題又稱為解碼問題,同樣的,暴力算法是計算所有可能性的概率,然后找出擁有最大概率值的隱藏狀態序列。與問題一的暴力解決方案類似,復雜度為O(NT)。
那應該用什么方案呢?
毫無疑問,還是動態規划啊!
5. 應用 HMM一開始是在信息論中應用的,后來才被應用到自然語言處理還有其他圖像識別等各個
說了這么多,HMM到底有什么應用呢?
HMM一開始是在信息論中應用的,后來才被應用到自然語言處理還有其他圖像識別等各個方面。下面舉兩個例子說明他的應用,一個是輸入法的整句解碼,一個是語音識別。有圖為證:
輸入法把拼音看做是觀察狀態,需要得到的漢字為隱藏狀態,這樣,輸入法的整句解碼就變成了維特比解碼,其轉移概率即是二元語言模型,其輸出概率即是多音字對應不同拼音的概率。
將上圖中的拼音換成語音,就成了語音識別問題,轉移概率仍然是二元語言模型,其輸出概率則是語音模型,即語音和漢字的對應模型。
6. 擴展數學之美系列十九 -- 馬爾可夫鏈的擴展 貝葉斯網絡 (Bayesian Networks)
6.1. 馬爾可夫鏈 (MarkovChain), 它描述了一種狀態序列,其每個狀態值取決於前面有限個狀態。
這種模型,對很多實際問題來講是一種很粗略的簡化。在現實生活中,很多事物相互的關系並不能用 一條鏈來串起來。它們之間的關系可能是交叉的、錯綜復雜的。比如在下圖中可以看到,心血管疾病和它的成因之間的關系是錯綜復雜的。顯然無法用一個鏈來表 示。
6.2. 上述的有向圖看 成一個網絡,它就是貝葉斯網絡
。其中每個圓圈表示一個狀態。狀態之間的連線表示它們的因果關系。比如從心血管疾病出發到吸煙的弧線表示心血管疾病可能和吸 煙有關。當然,這些關系可以有一個量化的可信度 (belief),用一個概率描述。我們可以通過這樣一張網絡估計出一個人的心血管疾病的可能性。在網絡中每個節點概率的計算,可以用貝葉斯公式來進行, 貝葉斯網絡因此而得名。由於網絡的每個弧有一個可信度,貝葉斯網絡也被稱作信念網絡 (belief networks)。
和馬爾可夫鏈類似,貝葉斯網絡中的每個狀態值取決於前面有限個狀態。不同的是,貝葉斯網絡比馬爾可夫鏈靈活,它不受馬爾可夫鏈的鏈狀結構的約束,因此可以更准確地描述事件之間的相關性。可以講,馬爾可夫鏈是貝葉斯網絡的特例,而貝葉斯網絡是馬爾可夫鏈的推廣。
6.3. 參考資料
隱馬爾科夫模型詳解 - - 博客頻道 - CSDN.NET.html
GMM-HMM語音識別模型 原理篇 - Rachel Zhang的專欄 - 博客頻道 - CSDN.NET.html
(2 條消息) 如何用簡單易懂的例子解釋隱馬爾可夫模型? - 知乎.html
數學之美系列十九 -- 馬爾可夫鏈的擴展 貝葉斯網絡 (Bayesian Networks) - Kevin Yang - 博客園.html
作者:: 綽號:老哇的爪子 ( 全名::Attilax Akbar Al Rapanui 阿提拉克斯 阿克巴 阿爾 拉帕努伊 )
漢字名:艾提拉(艾龍), EMAIL:1466519819@qq.com
轉載請注明來源:attilax的專欄 http://www.cnblogs.com/attilax/
--Atiend