Sphinx語音識別學習記錄（一）-基本運行測試

本文轉載自查看原文 2012-06-21 10:27 6488 自然語言處理/ cmusphinx

CMUSphinx系列目錄

http://www.cnblogs.com/yin52133/archive/2012/06/21/2557219.html - （一）基本運行測試

http://www.cnblogs.com/yin52133/archive/2012/07/12/2587282.html - （二）自然語言處理原理研究

http://www.cnblogs.com/yin52133/archive/2012/07/12/2587419.html - （三）小范圍語音英文識別

http://www.cnblogs.com/yin52133/archive/2012/07/12/2588201.html - （四）小范圍語音中文識別

http://www.cnblogs.com/yin52133/archive/2012/06/22/2558806.html - （五）錯誤調試

http://www.cnblogs.com/yin52133/archive/2012/07/12/2588418.html - （六）我的目標和幾個想像的方案（閑置中）

這一陣子因為個人的某個需求開始研究語音識別

找了一陣子之后決定選擇研究下cmusphinx

下面是官方的介紹

http://cmusphinx.sourceforge.net/wiki/

現在網上相關資料基本只有官方的幫助文檔和下面的Sphinx武林秘籍了

http://www.cnblogs.com/huanghuang/archive/2011/07/14/2106579.html

運行版本為

pocketsphinx 0.7

sphinxbase 0.7

先可以嘗試跟上面的武林秘籍里的一樣，跑起樣例項目pocketsphinx_continuous

這個有助於抓住基本使用方式和脈路

pocketsphinx_continuous 跟武林秘籍一樣輸入兩套參數的話我這里會報錯、會表示我沒指定聲學模型

我是添加了這個參數、使用自帶的模型算法

-hmm

hub4wsj_sc_8k

然后就是幾個參數的意義

hmm Hidden Markov Model隱馬爾可夫模型模型訓練算法
lm language model
dict 字典、這幾種東西以前沒搞過語音識別、完全不懂、從頭開始查資料學習的

command.txt

stop
music
computer
dump
close

用這個文本使用lmtool創建了語言模型和字典

7721.lm 7721.dic

pocketsphinx_continuous -hmm hub4wsj_sc_8k -lm 7721.lm -dict 7721.dic

中間運行到這

Allocating 32 buffers of 2500 samples each
READY....

Listening...

這里你就用麥克風說話、他就幫你識別是什么。。。空白時間間隔在1s時會停止錄音

下面這種是識別出來的結果

000000000: STOP (-6531224)

我使用的自帶的 hub4wsj_sc_8k 這個模型、不知道是口音問題還是基礎的模型問題、句子稍長點就老多識別出來好幾個dump

（該問題后面已找到問題並解決）

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Sphinx語音識別學習記錄（五）-錯誤調試 Sphinx語音識別學習記錄（三）-小范圍語音英文識別 Sphinx語音識別學習記錄（四）-小范圍語音中文識別 Sphinx語音識別學習記錄（六）-我的目標和幾個想像的方案（閑置中） Sphinx語音識別學習記錄（二）-自然語言處理原理研究（四）語音識別測試案例 #語音識別怎么測試？# 的用例梳理 IOS開發學習筆記（二）語音識別語音識別-TDNN Python 語音識別

Sphinx語音識別學習記錄 （一）-基本運行測試

免責聲明！

Sphinx語音識別學習記錄（一）-基本運行測試