采樣
采樣頻率
每秒從連續信號中提取並組成離散信號的采樣個數。用Hz表示,采樣頻率的倒數是采樣周期,即采樣之間的時間間隔。
通俗的講:采樣頻率是指計算機每秒鍾采集的多少聲音樣本。采樣頻率越高,即采樣的間隔時間越短,則在單位時間內計算機得到的聲音樣本數據就越多,對聲音波形的表示也越精確。
采樣定理
也稱作奈奎斯特采樣定理,只有采樣頻率高於聲音信號最高頻率的兩倍時,才能把數字信號表示的聲音還原成為原來的聲音。所以采樣定理確定了信號最高最高的頻率上限,或能獲取連續信號的所有信息的采樣頻率的下限。
舉例:如果有一個20Hz的語音和一個20KHz的語音,我們以44.1KHz的采樣率對語音進行采樣,
結果:20Hz語音每次振動被采樣了$\frac{40K}{20}=2000$次;
20KHz語音每次振動被采樣了$\frac{40K}{20K}=2$次;
所以在相同的采樣率下,記錄低頻的信息遠遠比高頻的詳細。
上采樣可以理解為信號的插值,下采樣可以理解為信號的抽取。
帶寬:采樣頻率的一半,最高頻率等於采樣頻率的一半。
混疊
混疊也稱為欠采樣,當采樣頻率小於最大截止頻率兩倍(奈奎斯特頻率)的時候就會發生信號重疊,這一現象叫做混疊。
為了避免混疊現象,通常采用兩種措施:
- 1、提高采樣頻率,達到信號最高頻率的兩倍以上;
- 2、輸入信號通過抗混疊濾波器(低通濾波器)進行濾波處理,過濾掉頻率高於采樣率一半的信號。
語譜圖和頻譜圖
語音波形圖
波形圖表示語音信號的響度隨時間變化的規律,橫坐標表示時間,縱坐標表示聲音響度,我們可以從時域波形圖中觀察語音信號隨時間變化的過程以及語音能量的起伏
頻譜圖
頻譜圖表示語音信號的功率隨頻率變化的規律,信號頻率與能量的關系用頻譜表示,頻譜圖的橫軸為頻率,變化為采樣率的一半(奈奎斯特采樣定理),縱軸為頻率的強度(功率),以分貝(dB)為單位
語譜圖
橫坐標是時間,縱坐標是頻率,坐標點值為語音數據能量,能量值的大小是通過顏色來表示的,顏色越深表示該點的能量越強。一條條橫方向的條紋,稱為“聲紋”。
頻譜圖和語譜圖的區別:
- A.頻譜圖(spectrum)來表示某一瞬間的波形圖中的頻率分布,而語譜圖則是研究一段時間內語音的變化,特別是頻率的變化
- C.頻譜圖表達了聲壓或振幅和頻率的關系,一個持續的元音可有一個穩定的頻譜圖,最低頻率峰值即為基頻,而高頻的峰值為諧音或泛音 (harmonics)
- D.根據濾波器的帶寬可將語譜圖分為兩類。帶寬為300Hz的寬帶語譜圖可以顯示細致的時間結構,但諧波結構不太清楚。帶寬為45Hz的窄帶語譜圖使時間的結構模糊,但是頻率的信息較好
- E.在頻譜圖包絡中可以有一些較寬的峰值,稱為共振峰(formant);在較寬的共振峰帶中可以看到個別的諧波頻率
量化(Quantisation)
將連續信號近似為有限個離散值的過程。主要應用於從連續信號到數字信號的轉換中。連續信號經過采樣成為離散信號,離散信號經過量化就成為了數字信號。這個時候相信大家都有疑問,離散信號跟數字信號有什么區別。
離散信號和數字信號的區別
連續信號(模擬信號)經過采樣成為離散信號(也稱為采樣信號),離散信號經過量化就成為了數字信號。
連續信號:信號連續,如正弦信;離散信號:信號不連續,只是一些離散的點,它的取值可以是無窮多種取值;
數字信號:如果是二進制量化,只有1,0兩種模式的信號。四進制數字信號只有四種取值,以此類推。數字信號幅度只取幾個量化的值代替區間。
增益單位dB
本意是表示兩個量的比值大小。
對於功率:$dB=10*\log_{10}(\frac{A}{B})$
對於電流或者電壓:$dB=20*\log_{10}(\frac{A}{B})$
A,B代表參與比較的功率值或者電流、電壓值。
dB的意義就是把就是把一個很大或者很小的數比較簡短地表示出來。如
X = 100000 = $10^5$ = 10*lg(X) | dB= $10*\lg(10^5)$ dB= 50 dB |
X = 0.000000000000001 = $10^{-15}$ | X(dB) = 10*lg(X) dB= $10*\lg(10^{-15})$ dB= -150 dB |
參考文獻