深度學習語音增強

本文轉載自查看原文 2018-12-08 16:08 1294

作者：YeBobr
鏈接：https://www.zhihu.com/question/273665262/answer/388296862
來源：知乎
著作權歸作者所有。商業轉載請聯系作者獲得授權，非商業轉載請注明出處。

最近在深度學習在語音增強中的應用最前沿的應該數GAN網絡了吧，把生成器當做增強網絡，用判別器區分干凈語音和增強語音。主要有如下兩篇論文：

在卷積神經網絡方面，有基於全卷積的，有基於冗余卷積的，在時域上和在頻域上處理語音。論文鏈接如下：

在DNN方面，主要是在頻域內處理語音，通過短時傅里葉變換求得短時頻譜，然后對短時頻譜進行處理，利用含噪語音的相位進行重構增強語音。還有一些小是DNN和傳統語音增強方法進行結合的辦法，把傳統語音中的features換成DNN網絡，基本這個套路。論鏈接如下：

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 深度學習語音降噪總結基於深度學習的單通道語音增強深度增強學習--DDPG 深度增強學習--DPPO 語音語義的深度學習深度增強學習--Policy Gradient 深度學習之圖像的數據增強深度學習中的數據增強技術（一）深度學習中的圖像增強深度學習-數據集增強-方法