【論文：麥克風陣列增強】Signal Enhancement Using Beamforming and Nonstationarity with Applications to Speech

本文轉載自查看原文 2017-06-06 14:11 1952 20-音頻信號

作者：桂。

時間：2017-06-06 13:25:58

鏈接：http://www.cnblogs.com/xingshansi/p/6943833.html

論文原文：http://pan.baidu.com/s/1hsuuQYK

前言

上一篇GSC是基於delay的框架進行處理，這是在無混響的情況下一種簡單近似處理。許多更為復雜的應用場景，如存在的混響較嚴重Rt=450ms，則基於delay的模型是不合適的，有學者就考慮直接利用系統的響應函數，也就是傳遞函數（Transfer function， TF）進行處理，這也就是本文要梳理的思路。

一、理論模型

模型：

其中

對應的頻域變換

M為麥克風的數量。

問題知道了，剩下就是建模求解。仍然可以是Frost's algorithm和GSC兩種框架。與原始問題基本的不同點就是一個：原始的利用delay的延時補償;此處是基於傳遞函數TF。用文中的話就是：

In Frost's algorithm, a beamforming algorithm was proposed under the assumption that the TF from the desired signal source to each sensor includes only gain and delay values. In this article, we consider the general case of arbitrary TFs.

二、理論求解

　　A-Frost's algorithm

濾波器頻域系數

濾波后的信號

濾波后輸出信號的均方值，也就是目標函數：

Frost's algorithm基於MVDR的思路，保證目標信號不失真（限制條件），最小化輸出功率（目標函數），這就是一個LCMV（linear constrained minimum variance）問題.約束條件：

總結一下求解的理論模型

同樣的思路，利用拉格朗日乘子法得出濾波器最優解

同之前的問題一樣，在實際的工程應用中：

This closed-form solution is difficult to implement and does not have the ability to track changes in the environment. Therefore, an adaptive solution should be more useful.

因此需要借助梯度下降的思路，利用自適應濾波（LMS、NLMS等）進行工程化的落地。

迭代思路

其中

W的迭代也可以進一步簡化：

可以看出實現中只要A已知，整個的框架就搭建完成，問題就轉換成：A如何求解？GSC框架也存在同樣的問題。如果A已知，此處的TF-Frost's algorithm和TF-GSC都可以工程化落地，但實際應用中A通常未知，所以論文也只是交代了思路，只有TF-GSC利用了一種參數轉化的思想進行參數估計，實現工程落地，而TF-Frost's algorithm並沒有落地，因此論文的實驗部分也僅僅是TF-GSC與基於delay的D-GSC對比，提前補充說明一下（個人理解，如果有誤還請幫忙指出）。

回顧一下基於delay的Frost's algorithm框架：

　　B-TF-GSC

GSC的思想與Frost's algorithm的不同在於，除了利用約束條件

假設矩陣N個自由度，約束條件利用了n個(Frost's algorithm)，GSC還利用了剩下的N-n個自由度：

更直觀的說，回顧基本GSC框架（本文方法的無t延遲操作）

上支的作用就是Frost's algorithm，下支的Block就是剩下的自由度，所以上支的W與下支的B需要正交，否則冗余。通常為了簡便，W與B直接給定，只優化Block之后的參數矩陣，這樣一來W就不是最優了，這也是為什么說GSC是Frost's algorithm的擴展不夠嚴謹，如果僅僅從理論框架來講，GSC就是Frost's algorithm的擴展。

TF-GSC框架的輸出

其中上支是

其中

F的定義

之所以可以W0等於F，是因為

滿足向量空間

下支是

因為是利用N-n的自由度，所以存在於向量空間

剩下就是自適應濾波求取G了。

進一步討論之前，再將GSC框架梳理一下（TF-GSC也屬於該框架）

1）上支：也就是fixed beamformer，構建帶噪的增強信號;例如本文的

2）下支:也就是Blcok matrix，構建噪聲參考信號;例如本文的

3）自適應部分：就是針對上支信號，利用下支得到的噪聲對其進行自適應處理，例如本文的

處理結束的信號，就是整個GSC框架增強的信號。

說說G的求解過程。

重新寫出自適應的准則函數

其中

利用最小二乘的思路

考慮到工程的適應性，通常用梯度下降的思想，借助最小二乘實現

也可以normalized一下，即NLMS

其中Pest的更新方式為

假設G求解完畢，如何工程化實現呢？一種設計思路是借助FIR

理論上G求解之后，利用最佳逼近，便可得出FIR的設計

細說就是三步走：1）將估計的時域變換;2）取時域的區間范圍內;3)將處理后的信號變換到頻域，認為是利用FIR設計的G，也就是G的最終估計。

三步走的操作可以讓迭代步驟更加Robust.

至此，理論分析已經結束。

　　C-參數轉化

然而直接求解/估計傳遞函數是困難的，這一點很容易理解，但絕對轉化為相對，求解就容易了。

1-上支

定義

W0重寫為

如果H歸一化，W0可簡寫

2-下支

一種構造方式（滿足正交空間即可）：

同樣可以由得到。

3-自適應

這一步按上面的思路工程上完全可以實現。

至此完成了原始問題的參數轉化，也就是將絕對求解轉化為相對求解，剩下就是的參數估計了。

　　D-參數估計

考慮到

即

從而

進一步得出

實際操作中，基於平穩遍歷的假設，近似估計：

利用K幀數據進行處理

從而實現H的估計：

<.>代表均值的操作

至此TF-GSC完成了理論分析→理論在工程的落地→實際應用的參數估計，反過來看就是整個工程實現的思路搭建完畢。

總結一下算法流程

參考

Gannot, Sharon, David Burshtein, and Ehud Weinstein. "Signal enhancement using beamforming and nonstationarity with applications to speech." IEEE Transactions on Signal Processing 49.8 (2001): 1614-1626.

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 【論文：麥克風陣列增強】Speech Enhancement Based on the General Transfer Function GSC and Postfiltering 【麥克風陣列增強】Delay and sum beamforming 麥克風陣列論文翻譯：Speech Enhancement Based on the General Transfer Function GSC and Postfiltering 【論文:麥克風陣列增強】Microphone Array Post-Filtering For Non-Stationary Noise Suppression 麥克風陣列的優勢以及與傳統天線陣列的區別電容麥與其他麥克風有什么不同？前端獲取麥克風錄音數據蘋果筆記本麥克風設置 iOS麥克風權限的檢測和獲取麥克風實時降噪方案筆記