這次wer由15%下降到0%了,后面跑更多的模型 LOG (apply-cmvn[5.2.124~1396-70748]:main():apply-cmvn.cc:162) Applied ce ...
path.sh主要設定路徑等 bin bash run.pl本地腳本,確定訓練與識別命令 train cmd utils run.pl decode cmd utils run.pl 確定waves yesno目錄 if d waves yesno then wget http: www.openslr.org resources waves yesno.tar.gz exit was: wget ...
2017-09-06 15:46 2 5324 推薦指數:
這次wer由15%下降到0%了,后面跑更多的模型 LOG (apply-cmvn[5.2.124~1396-70748]:main():apply-cmvn.cc:162) Applied ce ...
基本模型沒有變化,主要是調參,配置: %WER 65% 下降到了 15% 后面再繼續優化... Graph compilation finish!steps/decode.sh ...
詞參考的例子就是yes/no腳本。 --------------------------- ...
轉自: http://www.jianshu.com/p/5b19605792ab?utm_campaign=maleskine&utm_content=note&utm_mediu ...
Quantization)的方法.它既可用於語音通信中的波形或參數的壓縮,也可用於語音識別.尤其有限狀態矢 ...
在基於GMM-HMM的傳統語音識別里,比音素(phone)更小的單位是狀態(state)。一般每個音素由三個狀態組成,特殊的是靜音(SIL)由五個狀態組成。這里所說的狀態就是指HMM里的隱藏的狀態,而每幀數據就是指HMM里的觀測值。每個狀態可以用一個GMM模型表示(這個GMM模型的參數是通過訓練 ...
參考文檔:http://www.cnblogs.com/welen/p/7485151.html 寫在前面,本文雖然對大多數腳本進行了解釋,但只是初學者的理解,如果你認為讀起來不知所雲,建議從 kaldi 官方文檔 讀起,兩邊配合理解,可以解決很多看起來好像很難理解的東西。(官方 ...
http://blog.csdn.net/u013677156/article/details/77893661 1、kaldi解碼過程 kaldi識別解碼一段語音的過程是:首先提取特征,然后過聲學模型AM,然后過解碼網絡HCLG.fst,最后輸出識別結果。 HCLG是解碼時的重要組成部分 ...