【論文:麥克風陣列增強】Microphone Array Post-Filtering For Non-Stationary Noise Suppression


作者:桂。

時間:2017-06-08  08:01:41

鏈接:http://www.cnblogs.com/xingshansi/p/6957027.html 

原文鏈接:http://pan.baidu.com/s/1nvp1bJF


前言

理論上借助VAD可以實現噪聲估計,但這是遠遠不夠的,例如在low-SNR場景下,甚至Noise是non-staitonary,原文交代了噪聲估計的重要性:

The majority of the VAD algorithms encounter problems in low-SNR conditions, particularly when the noise is nonstationary [1,2]. Also, some of those algorithms require tuning. Having an accurate VAD algorithm in a nonstationary environment might not be sufficient in speech-enhancement applications, as an accurate noise estimate is required at all times, even during speech activity. Noise-estimation algorithms that continuously track the noise spectrum are therefore more suited for speech-enhancement applications in nonstationary scenarios. This is a particularly challenging task, as we need to somehow estimate the noise spectrum even during speech activity. However, as we will see in this chapter, this can be accomplished by exploiting a few key properties of the speech signal.

一、Single Microphone Noise Spectrum Estimation

這個思路就是借助之前文章里提到的OMLSA算法,omlsa算法主要分為四個模塊:

1-log-MMSE估計器;2-priori SNR估計;3-語音不存在概率估計;4-基於MCRA/IMCRA的噪聲估計。

MCRA結構圖:

細節可以參考之前的文章,這里就不再重復了。

 

二、Microphone Array Post-Filtering

原理框圖

其中

D分兩個部分是假設噪聲由穩態噪聲、瞬態噪聲兩部分組成。

對每一個分支分別計算平均功率譜,並借助MCRA實現噪聲譜估計,這兩個操作的具體細節參考之前的文章

定義變量(還起了一個名字TBRR

其中,可以看出也可以理解成語音存在概率,這樣一來判斷語音不存在概率的時候相當於多了一個評價的准則,如果綜合兩個弱分類器實現強分類就是接下來的問題了。

回顧single-channel中的q(語音不存在概率)定義式

給出multi-channel中的q定義式

其中,其實兩個評價准則結合主要體現在or上。

剩下的操作與single-channel就完全一致了。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM