Chapter 9:Noise-Estimation Algorithms

本文轉載自查看原文 2017-06-14 12:09 2591 20-音頻信號/ 讀書/ 噪聲譜估計

作者：桂。

時間：2017-06-14 12:08:57

鏈接：http://www.cnblogs.com/xingshansi/p/6956556.html

主要是《Speech enhancement: theory and practice》的讀書筆記，全部內容可以點擊這里。

書中代碼：http://pan.baidu.com/s/1hsj4Wlu，提取密碼：9dmi

前言

主要梳理單通道噪聲估計的一般方法，內容為自己的學習記錄，如果有不准確/錯誤的地方，還希望幫忙指出來。

一、算法原理

本文不打算作綜述類描述，只介紹幾種常用的噪聲估計算法，首先介紹一下噪聲估計的一般思路，噪聲估計主要基於以下三個現象：

現象一：在音頻信號中，閉塞因閉合段頻譜能量趨於零或接近噪聲水平，除此之外還會注意到：

靜默（silent）段出現在清摩擦音的低頻段，特別是2kHz以下的頻段;
靜默段(silent)出現在元音或一般的濁音（半元音、鼻音）期間的高頻段，通常是4kHz以上，如圖所示：

由於該特性，噪聲在頻譜上非均勻分布，不同頻帶具有不同的SNR，例如car噪聲則具有低頻特性，高頻部分受影響較小，從而高頻部分提取的帶噪譜可以更有效地估計和更新噪聲譜。更一般地，對於任意類型噪聲，只要該頻帶無語音的概率很高或者SNR很低，則可以估計/更新該頻帶的噪聲譜，這類思想是遞歸平均噪聲估計算法(the recursive-averaging type of noise-estimation algorithms)的支撐點。

現象二：即使在語音活動的區域，帶噪語音信號在單個頻帶的功率通常會衰減到噪聲的功率水平，我們因此可以追蹤在短時窗內（0.4~1s）帶噪語音譜每個頻帶的最小值，實現各個頻帶噪聲的估計。該現象是最小值跟蹤算法（the minima-tracking algorithms）的支撐點。

現象三：每個頻帶能量的直方圖揭示了一個理論：出現頻次最高的值對應頻帶的噪聲水平。有時譜能量直方圖有兩種模式：1）低能量對應無聲段、語音的低能量段;2）高能量模式對應（noisy）語音的濁音段。低能量成分大於高能量成分：

但這個現象並不是一成不變，作者進行實驗驗證得出了結論：通常低頻具有雙峰分布，中頻-高頻為單峰。以上現象，頻帶能量直方圖最大值對應頻帶的噪聲水平，這是直方圖噪聲估計算法（histogram-based noise-estimation algorithms）的支撐點。

總結一下，以上三個現象引出了三類噪聲估計算法：

遞歸平均噪聲算法
最小值跟蹤算法
直方圖噪聲估計算法

二、遞歸平均噪聲算法

這類方法有利用信噪比相關、加權譜平均、基於信號存在概率等方法，這里只介紹基於信號存在概率的遞歸平均噪聲估計算法，因為常用的MCRA及其變種就屬於該范疇。

先說基本框架

從而實現噪聲譜估計

剩下的就是一些常規的思路了。

　　A-似然比方法

兩個基本要點：1）利用ML准則估計概率;2）利用近似表達。

這樣一來，噪聲估計為

其實這就是平滑的思路，只不過平滑因子對應這里的存在概率

按照之前的分析，在DFT系數復高斯模型下，可以實現參數估計

這樣一來就完成了參數估計，噪聲實現估計，細節上還有很多修繕的地方，這里就不提了。

　　B-MCRA算法(Minima-Controlled Recursive-Averaging Algorithms)

1-MCRA基本框架

先說說MCRA的基本框架

噪聲譜估計

2-算法實現

　　寫到這里，想到作者去世已經近五年，心里非常非常難過。寫一本好書要花費多少的心血啊，而把研究做到如此細致、深入對后來人的幫助又是多么巨大。古人將修路造橋定義為大善之事，這些科研人員在科學道路上給后來人鋪平了道路，他們又何嘗不是修路人呢？今天讀着他們的著作，感受着他們的思想，卻連當面說些感謝話的機會也不再有！

步驟一：