Android離線語音識別(PocketSphinx)


近期做項目。用到離線語音識別。整了好久,查了好多方法。最終完畢。網上資料有點亂,並且大部分就是那幾個人寫的。一群人轉!以下我總結一下。也為后來人行個方便。


關於環境配置我就不多說了。我就是依照這個教程一步步來的,絕對是可行的。http://gaebolg.blog.163.com/blog/static/19826906820136232810723/



以下重點解說一下demo的執行和語音庫的配置(注意:上面那個教程的執行demo最后寫的一塌糊塗。能夠從拷貝聲學模型和語音庫那里開始看我的。)


首先,demo執行須要下面文件:pocketsphinx/model/en_US lm目錄( .dic文件, .lm文件),以及hmm目錄。假設認為麻煩能夠下載我提供的文件。http://download.csdn.net/detail/u011747781/8034061


以下進入重頭戲。就是怎樣設置屬於自己的中文語音庫:

1、編寫自己的命令集:

新建一個txt文件,輸入命令。如:


百度
谷歌

點擊文件。另存為。注意將編碼改為UTF-8格式。(正下方編碼選項)保存為txt文件。

2、利用在線工具http://www.speech.cs.cmu.edu/tools/lmtool.html將寫好的txt文件生成文件。下載tgz文件就可以(里面有全部文件),復制tgz壓縮包中的lm文件。由於僅僅有這個實用(假設是英語的話,dic文件能夠直接用,就不用我以下介紹的方法生成dic文件了!!



3、新建一個txt文件。在我給的data目錄里,有個叫做standard.dic的文件。那個是標准語音庫,ctrl+F 查找你須要的發音。拷貝到你新建的txt文件里。

格式例如以下:

百度 b ai d u

完事后存為UTF-8格式,改名為 .dic文件。


4、這樣屬於你的語音庫就建好了,僅僅需覆蓋我的data目錄中對應的dic , lm文件 就可以!


最后,奉上親測可用的完整demo  http://download.csdn.net/detail/u011747781/8034195



免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM