語音分離相關介紹


語音分離相關介紹

一.語音分離的起源和定義

起源:來自“雞尾酒會效應”,人類可以將注意力放在特定的所感興趣的消息上,可以摒棄環境中的噪聲等的干擾。

定義:指通過運用一定的方法從接受到的混合語音信號中計算出個體信號的信號處理技術,它大致可以分成兩個方向:第一,在語音信號中進行多個聲源之間的分離;第二,在語音信號中進行單一聲源與噪聲等干擾的分離。

二.語音分離方法

1 基於獨立成分分析方法(ICA,Independent Component Analysis)

       其是目前應用最廣泛的單麥克語音分離的方法,通過尋找多維數組中的統計獨立和非高斯成分來實現對語音信號的分離。在國外的發展速度較快。

2 基於計算聽覺場景分析方法(CASA,Computational Auditory Scene Analysis)

       該方法的基礎理論是獨占分配准則和閉包連續准則,其中,獨占分配准則指的是,在某一時刻,人類聽覺方法的諸多感官要素只能對唯一的聲音流起作用;閉包連續准則指的是,對於短時進入聽覺感官要素的非連續語音信息,人腦可以合理組織,從而恢復出完整的語音信息。該方法也是國外發展時間較長。

       基於CASA的語音分離方法憑借着無需提前假定和限制聲源信號的統計特性、混合方式和信道個數的種種優勢,正在迅速成為語音信號處理領域的熱門方法。

3 基於空間濾波方法(SF,Spatial Filtering)

       該方法指的是通過麥克風陣列對聲源信號進行采集,再利用波束形成和濾波算法對混合信號進行處理的語音分離方法。

       與單麥克的獨立成分分析相比,麥克風陣列有更好的拓撲結構,所以陣列有更好的空間分辨率,可以更好的獲取目標的時域、頻域和空域等信息。常用的陣列語音分離方法有:

•延遲-求和(DS,Delay-Sum)

       該方法首先計算每個聲源到麥克風陣列的每個陣元的距離和到達參考點(也是其中一個陣元)的距離差,然后根據差值計算相應的時延,並對各路語音信號進行延遲補償。最后利用各聲源的固定權值對同步后的各路信號進行乘積累加,便可將各聲源的信號分離開來。但由於是固定權重,所以不能對噪聲起到最大限度的抑制作用。

•麥克風陣列自適應語音分離方法

       該方法定期根據接收信號的協方差矩陣進行波束形成算法的權矢量更新,這樣波束主瓣就能進行實時調整,而且方向始終對准聲源信號,同時“零點”指向干擾噪聲。該方法是目前應用最為廣泛的語音分離方法。

•后置維納濾波麥克風陣列語音分離方法

       該方法就是在每個麥克風陣列的陣元后加一個設置的有限沖激響應濾波器,這個濾波器組的復加權系數由各路混合信號的延遲補償和幅度加權值共同決定,所以這種方法具有自適應性,即它的復加權系數有自適應性,最后,將所有的加權復系數進行累加便可以得到輸出信號,這種方法計算量最大,但是是時域直接處理的辦法,即輸出信號各段相位一致。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM