1994. 1.为什么要用三音素建模 单音素建模没有考虑协同发音效应,也就是上下文音素会对当前的中心音素 ...
三音素,音素的一种,与单音素 如t, iy, n 不同,三音素表示为如t iy n,即由三个单音素组成,与单音素iy类似,但其考虑了上下文的关系,即,上文为t,下文为n。 三音素和单音素都是一个隐马尔科夫模型 HMM 三音素是为了考虑上下文的信息 协同发音 倒谱特征提取时,汉宁窗向左 向右包含了冗余的频谱,因此,用三音素代替单音素是合理的 单音素复制为三音素后,状态的个数成指数增加,但复制后的状态 ...
2017-09-09 22:34 0 2640 推荐指数:
1994. 1.为什么要用三音素建模 单音素建模没有考虑协同发音效应,也就是上下文音素会对当前的中心音素 ...
目录 1. gmm-init-mono 模型初始化 2. compile-train-graghs 训练图初始化 3. align-equal-compiled 特征文 ...
在Kaldi中,单音素GMM的训练用的是Viterbi training,而不是Baum-Welch training。因此就不是用HMM Baum-Welch那几个公式去更新参数,也就不用计算前向概率、后向概率了。Kaldi中用的是EM算法用于GMM时的那三个参数更新公式,并且稍有改变 ...
准备工作 1.安装MFA库,参考官方文档 2.拼音词典可使用MFA中自带的mandarin字典,或下载普通话词典mandarin-for-montreal-forced-aligner-pre-t ...