麥克風陣列技術-beaforming開源算法源碼分析

本文轉載自查看原文 2021-02-26 17:23 506 音頻算法系列

在音頻前端處理算法中，beamforming算法是一個無法繞過的存在，隨着AI技術的廣泛發展，前端語音技術的需求也在呈現個性化的動態范圍。作為一個深耕音頻算法多年的老兵，發現站在巨人的肩膀上，才能做出對得起客戶的產品。今天就分析一下一個開源的beamforming算法。

步驟一：預處理

預處理內容：

A 加窗:為傅里葉變換做准備，防止頻譜泄露。
B 傅里葉變換：通過傅里葉變換，獲取每路麥克風的頻域值大小.
C 求權重因子：獲取每路麥克風的權重因子.

步驟二：beamforming流程

beamforming算法流程

A 加載加權過的頻譜數據
B 計算不同麥克風之間的互相關系數
C 尋找音頻方向源頭: 計算每個麥克風的最大能量
D 復位最大值相關的延時系數.
E 計算人聲可能范圍的概率系數

步驟三：跟蹤人聲聲源

跟蹤算法效果：

A 濾波器濾波：預測濾波器先進行濾波.
B 計算每個麥克風的先驗概率.
C 根據當前值計算概率
D 計算概率系數f的值.
E 計算並更新每個粒度的因子
F 添加或刪除跟蹤源
G 確認是否停止跟蹤某個源
H 計算每個源的位置
L 對每個源進行重采樣

步驟四：人聲分離

降噪處理流程：

A 加載分離后的源
B 噪聲統計
C 計算噪聲泄露
D 計算拉姆達因子
E 噪聲疊加
F 計算噪聲總量
G 提取人聲
H 增益因子應用

步驟四：后置濾波器

人聲提取流程：

A 加載跟蹤源
B 計算矩陣信息
C 計算每個幀信息
D 導出幀信息.

總的來說，該算法還是比較新的，各項指標比較完善，並且代碼水平寫的比較高。筆者分析完成之后，真是受益很大。

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 基於多麥克風陣列的聲源定位算法之GCC-PHAT原理分析基於麥克風陣列的聲源定位算法之GCC-PHAT 麥克風陣列（2）驅動開發及調試語音專題第一講，麥克風陣列的語音信號處理技術麥克風陣列的優勢以及與傳統天線陣列的區別麥克風陣列波束形成之DSB原理與實現【麥克風陣列增強】Delay and sum beamforming 雙麥克風降噪算法養成記 MEMS麥克風技術規格和術語闡釋麥克風嘯叫的產生機理和頻譜分析