操作系統 : Ubuntu18.04_x64
gcc版本 :7.4.0
簡介
Kaldi誕生於2009年的JohnsHopkins University,剛開始項目重點是子空間高斯模型(SGMM)建模和詞匯學習抽樣調查,代碼也是基於HTK進行的開發,現在也是C++作為主要語言。但是隨着更多參與者的加入,特別是對深度神經網絡(DNN)的支持,讓Kaldi的發展超過了其他幾個著名開源項目。更重要的是Kaldi的維護和更新非常及時,基本上每天都有新的進展報告,而且在跟進學術研究的新算法方面也更加快速。國外很多公司和研究機構也都在用Kaldi平台,當然國內更多的公司,其實也是基於這個平台做的改進,特別是最近幾年新興的公司和企業研究院。
官方網址: http://kaldi-asr.org/
github地址: https://github.com/kaldi-asr/kaldi
編譯
獲取源碼:
git clone https://github.com/kaldi-asr/kaldi
查看安裝步驟:
$ cat kaldi/INSTALL This is the official Kaldi INSTALL. Look also at INSTALL.md for the git mirror installation. [for native Windows install, see windows/INSTALL] (1) go to tools/ and follow INSTALL instructions there. (2) go to src/ and follow INSTALL instructions there. $
即:
1、進入 tools 目錄,按照 INSTALL 的說明進行安裝;
執行 extras/check_dependencies.sh 檢查依賴項,根據提示進行安裝; 然后執行 make -j 8 命令進行make(其中8是make時的並發數,可根據cpu數量修改);
2、安裝好 tools 目錄內容后,進入 src 目錄,按照 INSTALL 的說明進行安裝;
./configure --shared make depend -j 8 make -j 8
其中8是make時的並發數,可根據cpu數量修改。
使用示例
目錄: kaldi/egs/yesno
訓練文件: http://www.openslr.org/resources/1/waves_yesno.tar.gz
運行腳本:
source path.sh export LD_LIBRARY_PATH=${LD_LIBRARY_PATH}:/root/src/kaldi/tools/openfst/lib ./run.sh
正常結束:
... local/score.sh --cmd utils/run.pl data/test_yesno exp/mono0a/graph_tgpr exp/mono0a/decode_test_yesno local/score.sh: scoring with word insertion penalty=0.0,0.5,1.0 %WER 0.00 [ 0 / 232, 0 ins, 0 del, 0 sub ] exp/mono0a/decode_test_yesno/wer_10_0.0
如果下載源碼或訓練文件過慢,可從我分享的鏈接中獲取。
本文對應資源地址:https://pan.baidu.com/s/1ygrlvjgAcw0cXpQpIjNQIQ&shfl=sharepset
可關注微信公眾號后回復 19101901 獲取提取碼。
本文github地址:
https://github.com/mike-zhang/mikeBlogEssays/blob/master/2019/20191019_kaldi編譯及簡單使用.rst