孤立詞識別的幾種有效方案


(1)采用動態規划(Dynamic Programming)的方法。這是一種運算量較大,但技術上較簡單,正識率也較高的方法。其中的失真測度可以用歐氏距離(適於短時譜或倒譜參數),也可以用對數似然比距離(適於LPC參數).決策方法可用最近鄰域准則.
(2)采用矢量量化(Vector Quantization)的方法.它既可用於語音通信中的波形或參數的壓縮,也可用於語音識別.尤其有限狀態矢量量化(FSVQJ)方法,對於語音識別更為有效。決策方法一般用最小平均失真准則。
(3)采用隱馬爾柯夫模型(HMM)的方法,該模型的參數既可以用離散概率分布函數,也可以用最新的連續概率密度函數(如:正態高斯密度,高斯自回歸密度等)。決策方法則用最大后驗概率准則.
(4)采用混合技術的方法。例如:用矢量量化作為第一級識別(作為預處理,從而得出若干候選的識別結果),然后,再用DTW或HMM方法做最后的識別,因此,可有VQ(矢量化)/DTW和VQ/HMM等識別方法.
 
  目前,語音識別的匹配主要應用HMM和DTW兩種算法。DTW算法由於沒有一個有效地用統計方法進行訓練的框架,也不容易將低層和頂層的各種知識用到語音識別算法中,因此在解決大詞匯量、連續語音、非特定人語音識別問題時較之HMM算法相形見絀。HMM是一種用參數表示的,用於描述隨機過程統計特性的概率模型。而對於孤立詞識別,HMM算法和DTW算法在相同條件下,識別效果相差不大, 又由於DTW算法本身既簡單又有效,但HMM算法要復雜得多。它需要在訓練階段提供大量的語音數據,通過反復計算才能得到參數模型,而DTW算法的訓練中幾乎不需要額外的計算。鑒於此,DTW更適合本系統的要求。
 
參考文檔:


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM