語音交互技術——語音信號特征提取


1.短時能量分析(音強),決定短時能量特性有兩個條件:不同的窗口的形狀和長度。窗長越長,頻率分辨率越高,而時間分辨率越低(N為幀長,M為步長)。

image

*典型窗函數:矩形窗譜平滑性能好,但損失高頻成分,波形細節丟失,海明窗與之相反。一幀內含1~7個基音周期,10kHz下采100~200點。

imageimage

2.短時平均振幅分析:計算方法簡單,但清濁音的區分不如能量明顯。

image

3.短時過零分析:可以區分清音與濁音,濁音時具有較低的平均過零數,而清音時具有較高的平均過零數;可以從背景噪聲中找出語音信號,可用於判斷寂靜無語音和有語音的起點和終點位置。

image

4.短時相關分析:自相關用於研究信號本身,如信號波形的同步性、周期性等。用來區分清音和濁音,因為濁音信號是准周期性的,對濁音語音可以用自相關函數求出語音波形序列的基音周期;另外在進行語音信號的線性預測分析時,也要用到短時自相關函數。

image

image

image

4.短時平均幅度差:短時平均幅度差計算加、減法和和取絕對值的運算,與自相關函數的相加與相乘的運算相比,其運算量大大減小,尤其在硬件實現語音信號分析時有很大好處。為此,AMDF已被用在許多實時語音處理系統中。

image

image

5.短時傅里葉變換:

image

image

6.語音信號的倒譜分析:求語音倒譜特征參數,通過同態處理(將非線性問題轉化為線性問題)來實現。同態處理(同態濾波):解卷,將卷積關系變為求和處理。 將語音信號的聲門激勵和聲道響應分離開。

image

image

image

7.基音周期的提取:

a)自相關法:峰—峰值之間對應的就是基音周期。為去除聲道影響,一般進行中心削波的非線性變換(削除低幅部分)。

image

b)倒譜法:圖a為ln|X(ejw)|的示意圖,包括頻譜包絡的慢變分量,基音諧波峰值的快變分量。再取一次傅里葉反變換,即可將快慢分量分離開。

image

基音周期后處理:中值平滑、線性平滑、組合平滑。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM