先說下為什么要檢測語音基音周期
(1)基音決定了語音的音調。漢語是一種有調的語音,同一句話,語調不同,意義差別非常大,准確的檢測語音的基音周期,有利於“理解”話語中的意思。
(2)語音合成、聲調控制等音效果制作的需要。
再說下什么是基音周期
按照經典的語音激勵模型,聲帶周期性的張開和閉合所需要的時間,就是指基音的周期(
假如聲帶
某次從開啟到閉合的時間為
4ms
,那么,它的基音頻率為
250Hz
)。很顯然,要准確的檢測基音周期,需要盡可能的先去掉聲道模型和輻射模型的干擾。
一般來說,男性的基音頻率約為50Hz~250Hz,女性的基音頻率約為:100Hz~500Hz,所以我們通常把基音頻率的上限限制為500Hz,同時,又由於50Hz對應的是交流電的工頻頻率,難以去掉它的噪聲干擾,所以這個頻率檢測時也不予考慮。綜上,基音頻率的檢測范圍在60Hz~500Hz或者70Hz~500Hz比較好。
基音周期檢測的困難
(1)有些音的發音不具有聲帶的震動,通常這些音為過渡音。
(2)
基波的分量往往不是最強的分量,容易把一些濁音的諧波當做基波(這是因為經過聲道激勵后,一些諧波分量變的比較強)
(3)基音周期變化范圍大,從老年男人的
50Hz
到兒童和女性的
500Hz
,給檢測帶來了一定的困難。
基音周期檢測預處理
(1)端點檢測(多媒體核心技術群
中在2015-04-18日已經講過了)
(2)帶通濾波(60Hz~500Hz),盡可能去掉聲
道
模型和輻射模型的干擾(去掉
50Hz
是為了避免工頻噪聲的干擾)
基音周期估計的方法
(1)平均幅度差法
語音的濁音,通常會呈現出一定的周期性,這個周期性與基音的周期一致,通過計算平均幅度差,來找到這個周期,就可以得到基音的周期。
(2)相關法
同樣的道理,通過計算語音信號的自相關特性,並尋找相應的周期性,也可以得到語音的基音周期
(3)倒譜法
使用倒譜處理,使得脈沖激勵與聲道響應進行分離,再查找最大值,就可以得到語音的基音周期
(4)線性預測法
這類方法是先利用線性預測法,得到預測系數,再用這些系數去重建信號,這樣就弱化了聲道響應的影響。再進行自相關處理或者倒譜處理,就可以得到語音的基音周期