librosa.filters.mel其norm选项默认为"slaney",意为每个三角形滤波器的面积相同。
怎么绘制这个滤波器组的示意图呢?
- 在百度里面搜索 "Mel-filter bank with same bank area",发现stackoverflow里面有一个相关问题。
- librosa.filters.mel的返回值为一个(n_mels,n_fft/2+1)的ndarray,默认情况下是(128,1025)。在此ndarray中,每一行就是一个三角滤波器。
mel = librosa.filters.mel(22050,2408)
plt.plot(mel.T)
此图中,纵轴为权重(我的理解:类似于增益?),横轴不是频率,而是n_fft。
Questions:
- 如果想要以频率作为上图的x轴,需要做什么?
- 通过Mel滤波这一步就完成了频率Hz向梅尔频率Mel的转变吗?
通过查看librosa.spectrum.stft函数的说明:
- n_fft是分帧后,每个帧的数据点数量。在默认采样频率22050的情况下,n_fft设置为2048,即对应\(2047*\alpha * \frac{1}{22050}=0.09283446712018141\)秒的数据
- 此函数返回复值矩阵D,使得
np.abs(D[f,t])
是帧t
处的频率binf
的大小,而np.angle(D[f,t])
是帧t
处的频率binf
的相位。
整数t
和f
可以通过实用函数frame_to_sample
和fft_frequencies
转换为物理单位。
既然最高采样频率为22050,那么stft可以采集的信号的最高频率应该为11025,得到的频谱图的矩阵D为:np.ndarray [shape=(1 + n_fft/2, n_frames), dtype=dtype]
猜想每个bin对应\(11025/1024=10.7hz\)?