Android離線語音識別（PocketSphinx）

本文轉載自查看原文 2017-06-15 21:38 3807

近期做項目。用到離線語音識別。整了好久，查了好多方法。最終完畢。網上資料有點亂，並且大部分就是那幾個人寫的。一群人轉！以下我總結一下。也為后來人行個方便。

關於環境配置我就不多說了。我就是依照這個教程一步步來的，絕對是可行的。http://gaebolg.blog.163.com/blog/static/19826906820136232810723/

以下重點解說一下demo的執行和語音庫的配置（注意：上面那個教程的執行demo最后寫的一塌糊塗。能夠從拷貝聲學模型和語音庫那里開始看我的。）

首先，demo執行須要下面文件：pocketsphinx/model/en_US 下lm目錄（ .dic文件， .lm文件），以及hmm目錄。假設認為麻煩能夠下載我提供的文件。http://download.csdn.net/detail/u011747781/8034061

以下進入重頭戲。就是怎樣設置屬於自己的中文語音庫：

1、編寫自己的命令集：

新建一個txt文件,輸入命令。如：

百度
谷歌

點擊文件。另存為。注意將編碼改為UTF-8格式。（正下方編碼選項）保存為txt文件。

2、利用在線工具http://www.speech.cs.cmu.edu/tools/lmtool.html將寫好的txt文件生成文件。下載tgz文件就可以（里面有全部文件），復制tgz壓縮包中的lm文件。由於僅僅有這個實用（假設是英語的話，dic文件能夠直接用，就不用我以下介紹的方法生成dic文件了！！

）

3、新建一個txt文件。在我給的data目錄里，有個叫做standard.dic的文件。那個是標准語音庫，ctrl+F 查找你須要的發音。拷貝到你新建的txt文件里。

格式例如以下：

百度 b ai d u

完事后存為UTF-8格式，改名為 .dic文件。

4、這樣屬於你的語音庫就建好了，僅僅需覆蓋我的data目錄中對應的dic ， lm文件就可以！

最后，奉上親測可用的完整demo http://download.csdn.net/detail/u011747781/8034195

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Android開發之語音識別 Android studio語音識別 python實現離線語音識別 PocketSphinx語音識別系統語言模型的訓練和聲學模型的改進科大訊飛離線語音識別安裝與運行樹莓派——科大訊飛離線語音識別 Android語音播報、后台播報、語音識別 android語音識別 android.speech 包分析痞子衡嵌入式：語音處理工具pzh-speech誕生記（5）- 語音識別實現(SpeechRecognition, PocketSphinx0.1.15) Android語音識別（本地+第三方）