單麥克風遠場語音降噪解決方案

本文轉載自查看原文 2020-05-17 21:43 1470 音頻算法系列

一前記

通常來說遠場語音的作用距離是在1-10米之間，遠場語音識別技術主要通過麥克風陣列向聲源方位拾音。但是，在大多數的應用場景中，由於聲源附近存在電視噪、音樂噪聲、電話噪聲以及牆壁等障礙物的存在，產生了多徑反射、混響效應以及背景噪聲等加大了遠場語音信號的處理難度。尤其是說話人距離麥克風3米以上，這些干擾會明顯影響遠場麥克風的拾音效果。而且在遠距離條件下，語音信號隨距離增加幅值衰減嚴重。因此，如何對遠場語音信號進行降噪，引起了許多開發研究人員的關注。

遠場語音最早落地的應用是智能音箱，國內以阿里、百度等為代表推出了大眾化產品，國外以亞馬遜和谷歌為代表先於國內推出產品，值得一提的是亞馬遜目前在智能音箱這塊的研究做的最為完善，同時新一代的智能音箱集成有智能家居的控制HUB功能，大大拓寬了音箱的應用場景，阿里和百度目前借助國內的壟斷地位也開始在智能家居領域開始布局，宣稱在智能音箱中嵌入藍牙MESH技術，前期通過補貼方式進行市場開拓和圈地。其他應用領域目前都在早期嘗試階段，比如教育機器人、汽車語音助手、白色智能家電、智能廚電等。

隨着遠場語音應用的領域越來越廣泛，如何在遠距離條件下獲取較高質量的語音信號成為了越來越熱門的研究。作為一家AIOT方案公司，我們也一直致力於遠場語音信號的處理。我們的研究團隊不僅熟知語音增強算法、語音處理芯片等軟硬件條件；而且還在音頻處理領域有着深厚的理論基礎。在此基礎上我們不僅可以靈活地設計出效果不錯的語音增強技術方案，而且還能夠根據客戶的需求提供定制化的服務。

二系統原理

其實，遠場拾音的應用場景十分廣泛，它廣泛應用在會議，教育，娛樂等系統上。凡是和語音相關的產品，很多都涉及到人聲信號的提取和處理。所謂遠場語音降噪，就是能夠在人遠距離說話的情況下，周圍噪聲比較大的情況下，仍舊能夠把人的聲音信號提取出來。什么事情說起來都比較簡單，可是一旦做起來，真是不容易的，這中間涉及到的技術還真不少，下面一個圖可以簡潔的展出出來這個系統原理。