- date: 2022/1/9
- author: longRookie
- title: 麥克風陣列的優勢以及與傳統天線陣列的區別
一、麥克風陣列與天線陣列的不同
- 語音信號是寬帶信號
- 室內混響(或者多徑)效應顯著
- 環境特性和信號均高度非平穩
- 噪聲與目標語音信號可能具有相同的頻譜特性
- 傳感器的數據通常有限
- 人耳聽力具有極寬的動態范圍(聽力正常情況下高達120dB),並且對通道沖激響應的弱拖尾極其敏感。因此,濾波器模型的長度很長(抽頭數目數以千記的情況並不少見)
許多麥克風陣列處理算法都是借用窄帶陣列處理算法或者對其進行簡單推廣后得到的。缺點在於,這些算法並不是針對實際的聲學環境而設計,其性能往往受到很大限制。麥克風陣列需要處理的是寬帶信號。
二、通過麥克風陣列能夠解決的實際問題
- 噪聲抑制
- 回聲抑制
- 去混響
- 單聲源定位
- 聲源數目估計
- 多聲源定位
- 源分離
- 雞尾酒會效應
回聲抑制和去混響
在房間的免提通話場景下,麥克風采集到的語音信號不僅包含直接路徑傳播的信號,而且包含了由於房間邊界以及房間內物體的反射而產生的延遲衰減信號。這種多徑傳播效應在觀測信號中引入了回聲和譜失真,成為混響,這會嚴重影響源信號,造成信號質量和可懂度下降。因此,去除混響對提高語音信號的可懂度有很大的作用。
噪聲抑制
噪聲抑制算法的目的是從受到加性噪聲影響的觀測信號中估計出目標語音信號。然而,所有單麥克風噪聲抑制算法的主要問題在於它會使語音信號失真,盡管語音質量得到改善,但可懂度卻降低了。然而,采用麥克風陣列,卻可以在不太影響語音信號的條件下抑制噪聲(理論條件下可以實現)。
聲源定位,聲源數目估計與多聲源定位
在聲學環境下,聲源位置信息在自動攝像機跟蹤、噪聲抑制和去混響中波束方向的調整。要實現聲源的入射角度或者其在直角坐標系中位置的估計,需要采用二維或三維的麥克風陣列。對聲源數目的估計和對多個聲源的定位是兩個互相聯系的問題,對於窄帶信號源已有一些相關的算法,但在寬帶信號源中的研究剛剛起步(這里要打個問號,因為現在已經挺好的了)。
多麥克風聲源分離
在多麥克風聲源分離中,需要同時對來自不同方向的信號進行分離。由於不能直接獲取聲通道和聲源信號的信息,因此所有這些方法本質上都屬於盲處理。獨立成分分析(Independent Component Analysis,ICA)是盲源分離(Blind Source Seperation,BSS)問題中最為廣泛的工具,它充分利用了源信號的獨立性。在信號瞬時混合的情況下,多數基於ICA的算法都能獲得良好的性能,然而,在混響(卷積)環境下,此類算法的性能並不是很好。近年來,相關進展很大。
雞尾酒會效應
人類具有在嘈雜的談話環境或背景噪聲中專注於某一特定的話音或聲音的能力。這一有趣的心理聲學現象稱為雞尾酒會效應。從相關的心理聲學實驗中可以觀察到一個重要現象,即空間聽覺發揮着重要作用。這對於具有正常聽力和大腦處理能力的人毫不費力,但麥克風陣列信號處理仍然是一個極其復雜的問題,成為該領域所面臨的諸多挑戰的根源所在,直到今天仍然沒有一個明確的解決思路。