\documentclass{article} \usepackage{ctex} \usepackage{multicol} %用於實現在同一頁中實現不同的分欄 \begin{document} % 第一段不分欄 其參考點定義是將1000Hz,且高於人耳聽閾值40分貝以上的聲音信號,定為1000mel。在頻率500Hz以上時,人耳每感覺到等量的音高變化,所需要的頻率變化隨頻率增加而愈來愈大。這樣的結果是,在赫茲刻度500Hz往上的四個八度(一個八度即為兩倍的頻率),只對應梅爾刻度上的兩個八度。Mel的名字來源於單詞melody,表示這個刻度是基於音高比較而創造的。 \columnseprule=1pt % 實現插入分隔線 \begin{multicols}{2} % 分兩欄 若花括號中為3則是分三列 在提取過程中,MFCC首先對語音進行預處理,即\textbf{預加重、分幀和加窗}三個部分;然后對預處理的語音做快速傅里葉變換(Fast Fourier transform, FFT),再用Mel濾波器組濾波並對其取對數,最后做離散余弦變換求倒譜(Discreate consine transform, DCT),去除各維度信號之間的相關性,從而將信號映射到低維空間。在提取MFCC的基礎上,還可求取其一階、二階差分,共同組成Mel倒譜特性。 \end{multicols} \end{document}