資料來自kaldi官方文檔。
轉載注明出處。
1. ark特征文件
copy-feats
可以用來改變特征數據的格式,因此可以轉換ark格式文件為txt格式:
用法: copy-feats [options] <feats-rxfilename> <feats-wxfilename>
例子:
先查找copy-feats
的目錄(每個人可能不一樣):find /home/speech.AI/kaldi/ -name copy-feats
得到copy-feats
的目錄:
/home/speech.AI/kaldi/src/featbin/copy-feats
然后執行指令:
~/kaldi/src/featbin/copy-feats ark:foo.ark ark,t:foo.txt
ark存的是二進制文件,該指令為復制ark文件至txt文件下。
2. FST文件
查找fstprint
的目錄(每個人可能不一樣):find /home/speech.AI/kaldi/ -name fstprint
得到fstprint
所在目錄:
/home/speech.AI/kaldi/tools/openfst-1.6.7/src/bin/.libs/fstprint
/home/speech.AI/kaldi/tools/openfst-1.6.7/src/bin/fstprint
/home/speech.AI/kaldi/tools/openfst-1.6.7/bin/fstprint
使用fstprint
打印fst為文本格式:
~/kaldi/tools/openfst-1.6.7/bin/fstprint --isymbols=phones.txt --osymbols=words.txt L.fst L.txt
同理可以查看pdf格式的圖:
fstdraw [--isymbols=phones.txt --osymbols=words.txt] L.fst | dot –Tps | ps2pdf – L.pdf
例子:
~/kaldi/tools/openfst-1.6.7/bin/fstdraw --isymbols=phones.txt --osymbols=words.txt HCLG.fst
3. mdl模型文件
**gmm模型查看指令: ** gmm-copy [options] <model-in> <model-out>
如: gmm-copy --binary=false 1.mdl 1_txt.mdl
實例:
查找gmm-copy
的目錄:find /home/speech.AI/kaldi/ -name gmm-copy
得到gmm-copy
所在目錄(每個人可能不一樣):
/home/speech.AI/kaldi/src/gmmbin/gmm-copy
~/kaldi/src/gmmbin/gmm-copy --binary=false final.mdl final.txt
dnn模型查看用nnet-copy
:
~/kaldi/src/nnetbin/nnet-copy --binary=false 0.mdl final.txt
4. 決策樹文件
轉化為文本格式指令為:
copy-tree [--binary=false] <tree-in> <tree-out>
如:
copy-tree [--binary=false] tree tree.txt>
轉化為圖形格式指令為:
draw-tree [options] <phone-symbols> <tree>
如:
draw-tree phones.txt tree | dot -Gsize=8,10.5 -Tps | ps2pdf - tree.pdf
5. ali.gz對齊文件
對齊文件可以通過copy-int-vector
查看:
copy-int-vector [options] (vector-in-rspecifier) (vector-out-wspecifier)
實例:
~/kaldi/src/bin/copy-int-vector "ark:gunzip -c ali.1.gz|" ark,t:ali.txt
也可以先解壓,然后用show-alignments
查看 :
show-alignments [options] <phone-syms> <model> <alignments-rspecifier>
實例:
~/kaldi/src/bin/show-alignments phones.txt final.mdl ark:ali.1 > ali.1.txt
類似的有: ali-to-phones
, copy-int-vector
轉載請注明出處
謝謝