原文:Kaldi单音素模型 训练部分

在Kaldi中,单音素GMM的训练用的是Viterbi training,而不是Baum Welch training。因此就不是用HMM Baum Welch那几个公式去更新参数,也就不用计算前向概率 后向概率了。Kaldi中用的是EM算法用于GMM时的那三个参数更新公式,并且稍有改变。 Baum Welch算法更新参数时,因为要计算前向后向概率,很费时间,因此使用Viterbi Traini ...

2017-09-11 15:22 0 5970 推荐指数:

查看详情

kaldi基于GMM的单音素模型 训练部分

目录 1. gmm-init-mono 模型初始化 2. compile-train-graghs 训练图初始化 3. align-equal-compiled 特征文件均匀分割 4. gmm-acc-stats-ali 累积模型重估所需数据 5. ...

Sat Aug 04 19:04:00 CST 2018 0 980
单音素到三音素模型

1994. 1.为什么要用三音素建模 单音素建模没有考虑协同发音效应,也就是上下文音素会对当前的中心音素 ...

Tue Sep 12 22:35:00 CST 2017 2 6462
如何读取部分的预训练模型

1. 读取预训练模型和现有模型的重合部分 reference: https://discuss.pytorch.org/t/how-to-load-part-of-pre-trained-model/1113/3 2. 如果预训练模型有Module而目前的没有 参考 ...

Fri Jun 21 00:17:00 CST 2019 0 793
音素

音素音素的一种,与单音素(如t, iy, n)不同,三音素表示为如t-iy+n,即由三个单音素组成,与单音素iy类似,但其考虑了上下文的关系,即,上文为t,下文为n。 三音素单音素都是一个隐马尔科夫模型(HMM) 三音素是为了考虑上下文的信息(协同发音) 倒谱特征提取时,汉 ...

Sun Sep 10 06:34:00 CST 2017 0 2640
[转]kaldi ASR: DNN训练

作者:zqh_zy链接:http://www.jianshu.com/p/c5fb943afaba來源:简书著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。 本文通过简单kaldi源码,分析DNN训练声学模型时神经网络的输入与输出。在进行DNN训练之前需要用 ...

Thu Sep 21 19:34:00 CST 2017 0 3677
[转] 如何用kaldi训练好的模型做特定任务的在线识别

转自:http://blog.csdn.net/inger_h/article/details/52789339 在已经训练模型的情况下,需要针对一个新任务做在线识别应该怎么做呢? 一种情况是,用已有的声学模型和新训练的语言模型。 语言模型可以同srilm等工具训练 ...

Thu Sep 21 18:49:00 CST 2017 0 2687
Kaldi中的Chain模型

Chain模型训练流程 链式模型训练过程是MMI的无网格的版本,从音素级解码图生成HMM,对其使用前向后向算法,获得分母状态后验,通过类似的方式计算分子状态后验,但限于对应于转录的序列。 对于神经网络的每个输出索引(即对于每个pdf-id),我们计算(分子占有概率 - 分母占用概率 ...

Sun Sep 10 06:40:00 CST 2017 1 8010
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM