語音增強的幾個基本算法


前言

本文主要分為兩個部分:

  1)單通道語音增強:主要是《語音增強》書籍內容的梳理;

  2)麥克風陣列增強:主要記錄自己看的一些論文;

內容會持續更新,內容為個人的理解,如果存在偏差或者錯誤的地方,還希望各位幫忙指出來。

一、單通道語音增強

選讀《Speech enhancement: theory and practice》.主要是自己的讀書筆記.

Chapter 1:Introduction

第一章~第四章,主要介紹語音增強算法的基礎知識;

Chapter 2:Discrete-Time Signal Processing and Short-Time fourier Analysis

Chapter 3:Speech Production and Perception

Chapter 4:Noise Compensation by human listeners(略)

Chapter 5:Spectral-Subtractive Algorithms

主要介紹譜減法。

Chapter 6:Wiener Filtering

主要介紹維納濾波。

Chapter 7:Statistical-Model-Based Methods

主要介紹基於統計模型的語音算法,大框架分兩類:最大似然估計,最大后驗概率估計

Chapter 8:Subspace Algorithms

主要介紹子空間算法,其實就是利用不相關性,借助特征值分解/奇異值分解進行表達

Chapter 9:Noise-Estimation Algorithms

主要介紹噪聲估計的常用方法

Chapter 10:Evaluating Performance of Speech Enhancement

第十章、第十一章(其實是十二章),主要介紹性能評估的方面,例如指標的選取,對比方法的特性,等等。

Chapter 11:Comparison of Speech Enhancement Algorithms

 

二、麥克風陣列增強

  1. Delay and sum算法
  2. MVDR算法
  3. GSC算法
  4. TF-GSC算法
  5. Post-filtering算法
  6. TF-GSC與Post-filtering結合


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM