語音基音周期估計基礎


先說下為什么要檢測語音基音周期

(1)基音決定了語音的音調。漢語是一種有調的語音,同一句話,語調不同,意義差別非常大,准確的檢測語音的基音周期,有利於“理解”話語中的意思。
(2)語音合成、聲調控制等音效果制作的需要。
 
再說下什么是基音周期
按照經典的語音激勵模型,聲帶周期性的張開和閉合所需要的時間,就是指基音的周期( 假如聲帶 某次從開啟到閉合的時間為 4ms ,那么,它的基音頻率為 250Hz )。很顯然,要准確的檢測基音周期,需要盡可能的先去掉聲道模型和輻射模型的干擾。
 
一般來說,男性的基音頻率約為50Hz~250Hz,女性的基音頻率約為:100Hz~500Hz,所以我們通常把基音頻率的上限限制為500Hz,同時,又由於50Hz對應的是交流電的工頻頻率,難以去掉它的噪聲干擾,所以這個頻率檢測時也不予考慮。綜上,基音頻率的檢測范圍在60Hz~500Hz或者70Hz~500Hz比較好。
 
基音周期檢測的困難
(1)有些音的發音不具有聲帶的震動,通常這些音為過渡音。
(2) 基波的分量往往不是最強的分量,容易把一些濁音的諧波當做基波(這是因為經過聲道激勵后,一些諧波分量變的比較強)
(3)基音周期變化范圍大,從老年男人的 50Hz 到兒童和女性的 500Hz ,給檢測帶來了一定的困難。
 
基音周期檢測預處理
(1)端點檢測(多媒體核心技術群 中在2015-04-18日已經講過了)
(2)帶通濾波(60Hz~500Hz),盡可能去掉聲 模型和輻射模型的干擾(去掉 50Hz 是為了避免工頻噪聲的干擾)
 
基音周期估計的方法
(1)平均幅度差法
  語音的濁音,通常會呈現出一定的周期性,這個周期性與基音的周期一致,通過計算平均幅度差,來找到這個周期,就可以得到基音的周期。
(2)相關法
  同樣的道理,通過計算語音信號的自相關特性,並尋找相應的周期性,也可以得到語音的基音周期
(3)倒譜法
  使用倒譜處理,使得脈沖激勵與聲道響應進行分離,再查找最大值,就可以得到語音的基音周期
(4)線性預測法
  這類方法是先利用線性預測法,得到預測系數,再用這些系數去重建信號,這樣就弱化了聲道響應的影響。再進行自相關處理或者倒譜處理,就可以得到語音的基音周期


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM