時間分辨率和頻率分辨率
時間分辨率:信號頻率隨時間變化,要將這種頻率變化分辨出來。自然,窗越短越好,以使得在窗內信號頻率近似不變。
頻率分辨率:同一時間段有兩個(或更多)不同頻率的信號疊加在一起,要將這兩個信號分辨出來。那么,窗越長越好,以使得窗內兩個不同頻率的信號能展現出明顯差異:
例如,100Hz的信號和100.1Hz的信號疊加,一兩個周期恐怕看不出來,必須要足夠多的周期才能區別開。
短時傅里葉變換可以看做移位信號x[n+m]通過窗w[m]的傅里葉變換。當n改變時,信號x[m]滑動着通過窗w[m]。對每一個n,可以看到信號的一段不同部分。
當然,也可以看做將窗平移,而保持傅里葉分析的時間原點固定不變,由此可以得出稍許不同的另一個短時傅里葉變換定義式。
當窗對於所有m均為1,即不加窗時,X[n, λ)=Σx[n+m]e-jλm=Σx[n+m]e-jλ(n+m)ejλn=X(ejλ)ejλn。
因為短時傅里葉變換包含信號的平移,所以上式也就可以理解了:平移帶來相位的變化,於是X[n, λ)=X(ejλ)ejλn。(點n附近的序列移動到原點附近)
另外,若設m'=n+m,短時傅里葉變換還可以寫成下面的形式:
X[n, λ)=Σx[m']w[-(n-m')]ejλ(n-m')。
若設hλ[n]=w[-n]ejλn,那么短時傅里葉變換就是x[n]和hλ[n]的卷積(固定λ):
傅里葉變換本身就滿足交換性質和線性性質,短時傅里葉變換恰好又具備類似卷積的滑動過程。
對不同的λ(頻率),hλ[n]相當於對w[n]乘以不同頻率的復指數信號(施加不同頻率的復指數權),以便能夠將x[m]的相應頻率成分提取出來。
我們固定n時,信號和窗沒有相對滑動,這樣信號和窗的乘積在頻域就相當於兩者頻譜的卷積。在做這樣的卷積時,我們滑動W(ejω)得到Hλ(ejω)=W(ej(λ-ω)),得到一個通帶中心位於ω=λ的帶通濾波器,這個濾波器的通帶寬度(近似?)等於窗的傅里葉變換之主瓣的寬度。
在窗或信號的滑動過程中,對某一特定的n0,x[n0]可能會參與多個時間點的X[n, λ)計算。例如,若窗長度為5(w[0]~w[4]),那么計算X[0, λ]需要x[0:4],計算X[1, λ]需要x[1:5]……這樣,x[1]同時參與從X[-3, λ]直到X[1, λ)的計算過程。所以,STDTFT的計算結果在時間維度上是包含有冗余信息的。同樣,連續變量λ也可以離散化。這樣得到抽取后的X[rR, k]=X[rR, 2kπ/N),R為時間維度上的抽取間隔。當然,R不能大於窗的長度L。若DFT長度為N,那么只要滿足N≥L≥R[注],就可以重構信號。特殊情況就是N=L=R。
[注]實際上應該是L≥R,N≥R。