Kaldi語音識別CVTE模型實戰


一.下載訓練好的模型

  下載路徑:http://kaldi-asr.org/models/m2

  

二.上傳&配置

  1.上傳到kaldi/egs/目錄下

  

  2.解壓,tar -zxvf 0002_cvte_chain_model_v2.tar.gz

  

  備注:因HCLG.fst模型解壓后文件較大,在解壓過程中會出現停頓,等待片刻即可!

  

  3.將egs/wsj/s5中的steps和utils拷貝到egs/cvte/s5目錄下

  

  

  4.將egs/hkust/s5/local/score.sh拷貝到egs/cvte/s5/local/目錄下

  

  

  5.注釋掉kaldi/egs/cvte/s5/utils/lang/check_phones_compatible.sh中if語句中的exit 1

  

三.CVTE文件結構

  

四.運行示例腳本

  1.運行

  

  2.執行結果

bash: line 1:  5327 Killed                  ( nnet3-latgen-faster --frame-subsampling-factor=3 --frames-per-chunk=50 --extra-left-context=0 --extra-right-context=0 --extra-left-context-initial=-1 --extra-right-context-final=-1 --minimize=false --max-active=7000 --min-active=200 --beam=15.0 --lattice-beam=8.0 --acoustic-scale=1.0 --allow-partial=true --word-symbol-table=exp/chain/tdnn/graph/words.txt exp/chain/tdnn/final.mdl exp/chain/tdnn/graph/HCLG.fst "ark,s,cs:apply-cmvn --norm-means=true --norm-vars=false --utt2spk=ark:data/fbank/test/split1/1/utt2spk scp:data/fbank/test/split1/1/cmvn.scp scp:data/fbank/test/split1/1/feats.scp ark:- |" "ark:|lattice-scale --acoustic-scale=10.0 ark:- ark:- | gzip -c >exp/chain/tdnn/decode_test/lat.1.gz" ) 2>> exp/chain/tdnn/decode_test/log/decode.1.log >> exp/chain/tdnn/decode_test/log/decode.1.log
run.pl: job failed, log is in exp/chain/tdnn/decode_test/log/decode.1.log

  備注:因運行該模型要求的最小內存為64G,因此在低於64G的情況下會被直接Kill掉!

  3.參考別人的執行結果

   

  


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM