從單音素到三音素模型
1994. 1.為什么要用三音素建模 單音素建模沒有考慮協同發音效應,也就是上下文音素會對當前的中心音素 ...
三音素,音素的一種,與單音素 如t, iy, n 不同,三音素表示為如t iy n,即由三個單音素組成,與單音素iy類似,但其考慮了上下文的關系,即,上文為t,下文為n。 三音素和單音素都是一個隱馬爾科夫模型 HMM 三音素是為了考慮上下文的信息 協同發音 倒譜特征提取時,漢寧窗向左 向右包含了冗余的頻譜,因此,用三音素代替單音素是合理的 單音素復制為三音素后,狀態的個數成指數增加,但復制后的狀態 ...
2017-09-09 22:34 0 2640 推薦指數:
1994. 1.為什么要用三音素建模 單音素建模沒有考慮協同發音效應,也就是上下文音素會對當前的中心音素 ...
目錄 1. gmm-init-mono 模型初始化 2. compile-train-graghs 訓練圖初始化 3. align-equal-compiled 特征文 ...
在Kaldi中,單音素GMM的訓練用的是Viterbi training,而不是Baum-Welch training。因此就不是用HMM Baum-Welch那幾個公式去更新參數,也就不用計算前向概率、后向概率了。Kaldi中用的是EM算法用於GMM時的那三個參數更新公式,並且稍有改變 ...
准備工作 1.安裝MFA庫,參考官方文檔 2.拼音詞典可使用MFA中自帶的mandarin字典,或下載普通話詞典mandarin-for-montreal-forced-aligner-pre-t ...