參考 1、語音增強,2017年12月發表,偏基礎概述:https://blog.csdn.net/zhanglu_wind/article/details/78700393?locationNum=8&fps=1 2、RNNoise,2017年9月發表,深度學習用於噪聲抑制 ...
博主最近轉戰語音增強研究,剛學習了最基礎也是最成熟的方法 譜減法,最早是boll提出的 Suppression of acousic noise in speech using spectral subtraction 。http: blog.csdn.net leixiaohua article details 鏈接中的這邊博客給我幫助很大,比較詳細,matlab源碼也可以找到,對於剛入門音頻處 ...
2017-05-13 12:53 5 10129 推薦指數:
參考 1、語音增強,2017年12月發表,偏基礎概述:https://blog.csdn.net/zhanglu_wind/article/details/78700393?locationNum=8&fps=1 2、RNNoise,2017年9月發表,深度學習用於噪聲抑制 ...
前面的文章(語音降噪論文“A Hybrid Approach for Speech Enhancement Using MoG Model and Neural Network Phoneme Classifier”的研讀 )梳理了論文的思想。本篇就開始對其實踐,主要分以下幾步:1,基於一個語料庫 ...
前言 本文主要分為兩個部分: 1)單通道語音增強:主要是《語音增強》書籍內容的梳理; 2)麥克風陣列增強:主要記錄自己看的一些論文; 內容會持續更新,內容為個人的理解,如果存在偏差或者錯誤的地方,還希望各位幫忙指出來。 一、單通道語音增強 選讀《Speech ...
當前基於深度學習的語音降噪方法主要分為兩個類: 基於TF時頻域的方法 (有兩大類:基於mask和非基於mask的方法) 基於時域的方法,就我自己的實驗結果來說,基於時域的方法比基於TFmask的方法要差一些,可能這樣方法的trick更多一些吧。 基於時頻域方法中 ...
前面的幾篇文章講了webRTC中的語音降噪。最近又用到了基於MCRA-OMLSA的語音降噪,就學習了原理並且軟件實現了它。MCRA主要用於噪聲估計,OMLSA是基於估計出來的噪聲去做降噪。類比於webRTC中的降噪方法,也有噪聲估計(分位數噪聲估計法)和基於估計出來的噪聲降噪(維納濾波),MCRA ...
噪聲問題一直是語音識別的一個老大難的問題,在理想的實驗室的環境下,識別效果已經非常好了,之前聽很多音頻算法工程師抱怨,在給識別做降噪時,經常發現WER不降反升,降低了識別率,有點莫名其妙,又無處下手。 剛好,前段時間調到了AIlab部門,有機會接觸這塊,改善語音識別的噪聲問題,雖然在 ...
上篇文章(基於混合模型的語音降噪實踐)實踐了基於混合模型的算法來做語音降噪,有了一定的降噪效果。本篇說說怎么樣來提升降噪效果。 算法里會算每個音素的高斯模型參數,也會建一個音素分類的神經網絡模型。這些都是依賴於音素對齊的,音素對齊做的越好,每個音素的高斯模型越准確,音素分類模型越收斂准確率 ...
一.處理源語音 1.定位: 2.仿造load_preprocess_wav()函數讀入音頻 3.新建enhance.py文件,主要使用減譜法和自適應濾波器法,代碼如下: 4.在__init__.py文件中調用enhance() 二.處理生成語音 1.定位:我選擇在UI界面中 ...