Sphinx語音識別學習記錄 (一)-基本運行測試


CMUSphinx系列目錄
http://www.cnblogs.com/yin52133/archive/2012/06/21/2557219.html - (一)基本運行測試

http://www.cnblogs.com/yin52133/archive/2012/07/12/2587282.html - (二)自然語言處理原理研究

http://www.cnblogs.com/yin52133/archive/2012/07/12/2587419.html - (三)小范圍語音英文識別

http://www.cnblogs.com/yin52133/archive/2012/07/12/2588201.html - (四)小范圍語音中文識別

http://www.cnblogs.com/yin52133/archive/2012/06/22/2558806.html - (五)錯誤調試

http://www.cnblogs.com/yin52133/archive/2012/07/12/2588418.html - (六)我的目標和幾個想像的方案(閑置中)

 

這一陣子因為個人的某個需求開始研究語音識別

找了一陣子之后決定選擇研究下cmusphinx

下面是官方的介紹

http://cmusphinx.sourceforge.net/wiki/

現在網上相關資料基本只有官方的幫助文檔和下面的Sphinx武林秘籍了

http://www.cnblogs.com/huanghuang/archive/2011/07/14/2106579.html

運行版本為

pocketsphinx 0.7

sphinxbase 0.7

 先可以嘗試跟上面的 武林秘籍里的一樣,跑起樣例項目pocketsphinx_continuous

這個有助於抓住基本使用方式和脈路

pocketsphinx_continuous 跟武林秘籍一樣輸入兩套參數的話 我這里會報錯、會表示我沒指定聲學模型

我是添加了這個參數、使用自帶的模型算法

-hmm

hub4wsj_sc_8k

然后就是幾個參數的意義

hmm Hidden Markov Model隱馬爾可夫模型 模型訓練算法
lm language model
dict 字典、 這幾種東西以前沒搞過語音識別、完全不懂、從頭開始查資料學習的

 

 command.txt

stop
music
computer
dump
close

用這個文本使用lmtool創建了語言模型和字典

7721.lm   7721.dic

pocketsphinx_continuous -hmm hub4wsj_sc_8k -lm 7721.lm -dict 7721.dic 

 

中間運行到這

Allocating 32 buffers of 2500 samples each
READY....

Listening...

這里你就用麥克風說話、他就幫你識別是什么。。。空白時間間隔在1s時會停止錄音

下面這種是識別出來的結果

000000000: STOP (-6531224)

我使用的自帶的 hub4wsj_sc_8k 這個模型、不知道是口音問題還是基礎的模型問題、句子稍長點就 老多識別出來好幾個dump

 (該問題后面已找到問題並解決)


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM