近期做項目。用到離線語音識別。整了好久,查了好多方法。最終完畢。網上資料有點亂,並且大部分就是那幾個人寫的。一群人轉!以下我總結一下。也為后來人行個方便。
關於環境配置我就不多說了。我就是依照這個教程一步步來的,絕對是可行的。http://gaebolg.blog.163.com/blog/static/19826906820136232810723/
以下重點解說一下demo的執行和語音庫的配置(注意:上面那個教程的執行demo最后寫的一塌糊塗。能夠從拷貝聲學模型和語音庫那里開始看我的。)
首先,demo執行須要下面文件:pocketsphinx/model/en_US 下lm目錄( .dic文件, .lm文件),以及hmm目錄。假設認為麻煩能夠下載我提供的文件。http://download.csdn.net/detail/u011747781/8034061
以下進入重頭戲。就是怎樣設置屬於自己的中文語音庫:
1、編寫自己的命令集:
新建一個txt文件,輸入命令。如:
百度
谷歌
點擊文件。另存為。注意將編碼改為UTF-8格式。(正下方編碼選項)保存為txt文件。
2、利用在線工具http://www.speech.cs.cmu.edu/tools/lmtool.html將寫好的txt文件生成文件。下載tgz文件就可以(里面有全部文件),復制tgz壓縮包中的lm文件。由於僅僅有這個實用(假設是英語的話,dic文件能夠直接用,就不用我以下介紹的方法生成dic文件了!!
)
3、新建一個txt文件。在我給的data目錄里,有個叫做standard.dic的文件。那個是標准語音庫,ctrl+F 查找你須要的發音。拷貝到你新建的txt文件里。
格式例如以下:
百度 b ai d u
完事后存為UTF-8格式,改名為 .dic文件。
4、這樣屬於你的語音庫就建好了,僅僅需覆蓋我的data目錄中對應的dic , lm文件 就可以!
最后,奉上親測可用的完整demo http://download.csdn.net/detail/u011747781/8034195