kaldi運行thchs30例子 - 碼上歡樂

相關內容簡體繁體

kaldi運行thchs30例子

本文轉載自查看原文 2017-09-18 15:10 5838 從零開始學kaldi

首先，thchs30有兩種數據庫，kaldi運行的數據庫最好是 thchs30-openslr。

修改run.sh里面的語音庫路徑 thchs30=...

修改nj線程數等於CPU的核心數

修改cmd.sh queue.pl 改為run.pl本地機器跑

運行出現錯誤:

lexicon.txt驗證出錯

里面binary file matches

這是grep的問題，grep -v -a '<s>' | grep -v -a '</s>' | sort -u > data/dict/lexicon.txt || exit 1;

---------------------------------------------------------------------------------------------------------------------------

在線識別部分：

去egs下，打開voxforge，里面有個online_demo，直接考到thchs30下。在online_demo里面建2個文件夾online-data work,在online-data下建兩個文件夾audio和models，audio下放你要回放的wav，models建個文件夾tri1，把s5下的exp下的tri1下的final.mdl和35.mdl（final.mdl是快捷方式）考過去。把s5下的exp下的tri1下的graph_word里面的words.txt,和HCLG.fst，考到models的tri1下。

類似處理，包括tri2b,tri3b,tri4b，不過后者需要添加轉移矩陣，final.mat以及所指的mat文件。

如下所示，例如 tri2b文件夾下，

打開online_demo的run.sh

a)將下面這段注釋掉：（這段是voxforge例子中下載現網的測試語料和識別模型的。我們測試語料自己准備，模型就是tri1了）

if [ ! -s ${data_file}.tar.bz2 ]; then
echo "Downloading test models and data ..."
wget -T 10 -t 3 $data_url;

if [ ! -s ${data_file}.tar.bz2 ]; then
echo "Download of $data_file has failed!"
exit 1
fi
fi

b) 然后再找到如下這句，將其路徑改成tri1

# Change this to "tri2a" if you like to test using a ML-trained model
ac_model_type=tri2b

if [ -s $ac_model/final.mat ]; then
trans_matrix=$ac_model/final.mat
echo "set matrix"
fi

online-gmm-decode-faster --rt-min=0.5 --rt-max=0.7 --max-active=4000 \
--beam=12.0 --acoustic-scale=0.0769 --left-context=3 --right-context=3 $ac_model/final.mdl $ac_model/HCLG.fst \
$ac_model/words.txt '1:2:3:4:5' $trans_matrix;;

識別效果很差

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 kaldi使用thchs30數據進行訓練並執行識別操作 Ubuntu16.04配置有GPU的kaldi環境，並運行thchs-30模型 kaldi 運行voxforge例子在vcs中編譯及運行測試E203例子 dubbox2.8.4例子教程一 dubbox2.8.4例子教程二 sqlserver 常用的練習50例子一個IPv6例子 velocity1.7小例子 Kaldi樣例實戰

粵ICP備18138465號 © 2018-2026 CODEPRJ.COM