1.短時能量分析(音強),決定短時能量特性有兩個條件:不同的窗口的形狀和長度。窗長越長,頻率分辨率越高,而時間分辨率越低(N為幀長,M為步長)。
*典型窗函數:矩形窗譜平滑性能好,但損失高頻成分,波形細節丟失,海明窗與之相反。一幀內含1~7個基音周期,10kHz下采100~200點。
2.短時平均振幅分析:計算方法簡單,但清濁音的區分不如能量明顯。
3.短時過零分析:可以區分清音與濁音,濁音時具有較低的平均過零數,而清音時具有較高的平均過零數;可以從背景噪聲中找出語音信號,可用於判斷寂靜無語音和有語音的起點和終點位置。
4.短時相關分析:自相關用於研究信號本身,如信號波形的同步性、周期性等。用來區分清音和濁音,因為濁音信號是准周期性的,對濁音語音可以用自相關函數求出語音波形序列的基音周期;另外在進行語音信號的線性預測分析時,也要用到短時自相關函數。
4.短時平均幅度差:短時平均幅度差計算加、減法和和取絕對值的運算,與自相關函數的相加與相乘的運算相比,其運算量大大減小,尤其在硬件實現語音信號分析時有很大好處。為此,AMDF已被用在許多實時語音處理系統中。
5.短時傅里葉變換:
6.語音信號的倒譜分析:求語音倒譜特征參數,通過同態處理(將非線性問題轉化為線性問題)來實現。同態處理(同態濾波):解卷,將卷積關系變為求和處理。 將語音信號的聲門激勵和聲道響應分離開。
7.基音周期的提取:
a)自相關法:峰—峰值之間對應的就是基音周期。為去除聲道影響,一般進行中心削波的非線性變換(削除低幅部分)。
b)倒譜法:圖a為ln|X(ejw)|的示意圖,包括頻譜包絡的慢變分量,基音諧波峰值的快變分量。再取一次傅里葉反變換,即可將快慢分量分離開。
基音周期后處理:中值平滑、線性平滑、組合平滑。