什么是共振峰及共振峰的作用
前面講過語音的激勵模型,當聲門周期脈沖激勵信號通過聲道時,會在聲道內引起共振作用(這個過程在語音產生模型中叫做聲道模型),從而產生一組共振頻率,這組共振頻率就被稱為共振峰(頻率),通常認為,語音譜包絡中的幾個極大值就是共振峰頻率。准確的檢測共振峰頻率和帶寬,有利於區分不同韻母,從於提高對語音語義的識別度。
共振峰估計的困難
(1)虛假共振峰的存在。
(2)相鄰共振峰頻率離的比較近時難以區分
(3)高音調語音的提取有一定困難。
總之,跟基音周期估計一樣,目前尚沒有一個完全准確的估計方法。
共振峰估計預處理
(1)預加重。目的是為了對去除口唇輻射的影響,便於對聲道響應進行分析。
(2)端點檢測。目的跟基音周期估計一樣,不需要對靜音段的語音做分析。
共振峰估計的方法
(1)倒譜法。
對語音做倒譜處理可以把激勵信號與聲道響應分離出來,然后去掉激勵信號,之后再做傅里葉變換,就可以得到聲道響應的包絡線,對包絡上尋找極大值,就是相應的共振峰頻率。
(2)LPC法
由於通過線性預測我們可以求出一組預測系數,根據這組系數和全極點聲道響應模型進行FFT變換,就可以得到聲道傳遞函數的功率譜,再通過計算得到相應的極大值,就可以得到對應的共振峰頻率
(3)HHT法
這個方法還沒有細看,具體步驟還不詳,主要是通過經驗模態分解(EMD)和希爾伯特變換來求信號的幅值,頻率、相位。