CMUSphinx系列目錄
http://www.cnblogs.com/yin52133/archive/2012/06/21/2557219.html - (一)基本運行測試 http://www.cnblogs.com/yin52133/archive/2012/07/12/2587282.html - (二)自然語言處理原理研究 http://www.cnblogs.com/yin52133/archive/2012/07/12/2587419.html - (三)小范圍語音英文識別 http://www.cnblogs.com/yin52133/archive/2012/07/12/2588201.html - (四)小范圍語音中文識別 http://www.cnblogs.com/yin52133/archive/2012/06/22/2558806.html - (五)錯誤調試 http://www.cnblogs.com/yin52133/archive/2012/07/12/2588418.html - (六)我的目標和幾個想像的方案(閑置中)
這一陣子因為個人的某個需求開始研究語音識別
找了一陣子之后決定選擇研究下cmusphinx
下面是官方的介紹
http://cmusphinx.sourceforge.net/wiki/
現在網上相關資料基本只有官方的幫助文檔和下面的Sphinx武林秘籍了
http://www.cnblogs.com/huanghuang/archive/2011/07/14/2106579.html
運行版本為
pocketsphinx 0.7
sphinxbase 0.7
先可以嘗試跟上面的 武林秘籍里的一樣,跑起樣例項目pocketsphinx_continuous
這個有助於抓住基本使用方式和脈路
pocketsphinx_continuous 跟武林秘籍一樣輸入兩套參數的話 我這里會報錯、會表示我沒指定聲學模型
我是添加了這個參數、使用自帶的模型算法
-hmm
hub4wsj_sc_8k
然后就是幾個參數的意義
hmm Hidden Markov Model隱馬爾可夫模型 模型訓練算法
lm language model
dict 字典、 這幾種東西以前沒搞過語音識別、完全不懂、從頭開始查資料學習的
command.txt
stop
music
computer
dump
close
用這個文本使用lmtool創建了語言模型和字典
7721.lm 7721.dic
pocketsphinx_continuous -hmm hub4wsj_sc_8k -lm 7721.lm -dict 7721.dic
中間運行到這
Allocating 32 buffers of 2500 samples each
READY....
Listening...
這里你就用麥克風說話、他就幫你識別是什么。。。空白時間間隔在1s時會停止錄音
下面這種是識別出來的結果
000000000: STOP (-6531224)
我使用的自帶的 hub4wsj_sc_8k 這個模型、不知道是口音問題還是基礎的模型問題、句子稍長點就 老多識別出來好幾個dump
(該問題后面已找到問題並解決)
