通常來說遠場語音的作用距離是在1-10米之間,遠場語音識別技術主要通過麥克風陣列向聲源方位拾音。但是,在大多數的應用場景中,由於聲源附近存在電視噪、音樂噪聲、電話噪聲以及牆壁等障礙物的存在,產生了多徑反射、混響效應以及背景噪聲等加大了遠場語音信號的處理難度。尤其是說話人距離麥克風3米以上,這些干擾會明顯影響遠場麥克風的拾音效果。而且在遠距離條件下,語音信號隨距離增加幅值衰減嚴重。因此,如何對遠場語音信號進行降噪,引起了許多開發研究人員的關注。
遠場語音最早落地的應用是智能音箱,國內以阿里、百度等為代表推出了大眾化產品,國外以亞馬遜和谷歌為代表先於國內推出產品,值得一提的是亞馬遜目前在智能音箱這塊的研究做的最為完善,同時新一代的智能音箱集成有智能家居的控制HUB功能,大大拓寬了音箱的應用場景,阿里和百度目前借助國內的壟斷地位也開始在智能家居領域開始布局,宣稱在智能音箱中嵌入藍牙MESH技術,前期通過補貼方式進行市場開拓和圈地。其他應用領域目前都在早期嘗試階段,比如教育機器人、汽車語音助手、白色智能家電、智能廚電等。
隨着遠場語音應用的領域越來越廣泛,如何在遠距離條件下獲取較高質量的語音信號成為了越來越熱門的研究。作為一家AIOT方案公司,我們也一直致力於遠場語音信號的處理。我們的研究團隊不僅熟知語音增強算法、語音處理芯片等軟硬件條件;而且還了解語音信號、噪聲信號的一些特性。在此基礎上我們不僅可以靈活地設計出效果不錯的語音增強技術方案,而且我們的核心的算法能夠根據客戶的需求提供定制化的服務。
我們的技術特色:
- 可以實現多重降噪
該模塊支持單麥克降噪和雙麥克降噪,根據客戶的需求來進行選擇配置。有多種降噪模式可以使用,降噪模式還可以根據GPIO按鍵來進行靈活選擇。
- 可以實現遠場拾音
我們的方案遠場拾音功能效果非常的好,通過搭載特定的麥克風,不僅可以實現近距離聲音不飽和,而且我們可以達到最遠10米以上的識別效果。
-
接口豐富:
一般人會問這個問題,你這個模塊,對外的接口是什么呢?該模塊的接口非常豐富。可以通過高速串口、I2S、USB三種接口導出音頻。該方案還可以實現小型聲卡的功能,即通過迷你USB,直接插到電腦和手機進行錄音。 -
個性化語音提示功能
該模塊內部存儲空間比較大,可以根據客戶的需求進行定制化的語音提示功能。比如,客戶想播報一段表白語言或一段特殊的聲音等,都可以利用該模塊實現。
場景示意圖:
系統原理圖:
我們的遠場降噪效果:
下面是我用同樣參數的麥克風,在不同場景下錄制的數據。圖3的場景是在家里,在距離麥克風60cm的距離一直播放高斯白噪聲的情況下錄制的;圖4是在吵鬧的咖啡店錄制的。兩組采音是我分別站在1m、3m、5m、10m左右的位置錄制的。兩個圖中上面信道是原始聲音,下面是各種處理之后的聲音。
圖3
圖4
從兩幅圖中我們可以明顯的看到處理后的語音效果,即使在遠場中語音信號被各種噪聲淹沒,但是經我們處理過后仍然可以提取出有效的信號。由於本人的說話音量較小,導致在錄制過程中聲音幅度比較小,但是即使這樣依然不影響我們遠距離的拾音效果,經過我們的算法處理后10m遠的有效信號仍然可以被提取出來。
錄音識別效果可通過百度盤鏈接查看:
鏈接:https://pan.baidu.com/s/1pCZNVdhCArVda_TuVtwtMA
提取碼:5twl