上篇文章(基于混合模型的语音降噪实践)实践了基于混合模型的算法来做语音降噪,有了一定的降噪效果。本篇说说怎么样来提升降噪效果。 算法里会算每个音素的高斯模型参数,也会建一个音素分类的神经网络模型。这些都是依赖于音素对齐的,音素对齐做的越好,每个音素的高斯模型越准确,音素分类模型越收敛准确率 ...
前面的文章 语音降噪论文 A Hybrid Approach for Speech Enhancement Using MoG Model and Neural Network Phoneme Classifier 的研读 梳理了论文的思想。本篇就开始对其实践,主要分以下几步: ,基于一个语料库算出每个音素的单高斯模型 ,训练一个输出是一帧是每个音素概率的NN分类判别模型 ,算法实现及调优。 ,得 ...
2021-06-18 08:01 0 339 推荐指数:
上篇文章(基于混合模型的语音降噪实践)实践了基于混合模型的算法来做语音降噪,有了一定的降噪效果。本篇说说怎么样来提升降噪效果。 算法里会算每个音素的高斯模型参数,也会建一个音素分类的神经网络模型。这些都是依赖于音素对齐的,音素对齐做的越好,每个音素的高斯模型越准确,音素分类模型越收敛准确率 ...
当前基于深度学习的语音降噪方法主要分为两个类: 基于TF时频域的方法 (有两大类:基于mask和非基于mask的方法) 基于时域的方法,就我自己的实验结果来说,基于时域的方法比基于TFmask的方法要差一些,可能这样方法的trick更多一些吧。 基于时频域方法中 ...
导读 随着音视频会议、娱乐互动直播、在线教育产品的火热发展,产品中令人愉悦的音效音质体验是必不可少的。但在音视频实时通信中,难免会遇到各种我们不希望出现的声音,例如电流声、键盘敲击声、嘈杂声等,这些统称为噪声。抑制这些声音的技术为降噪。本文我们将从语音降噪的概念入手,详细分析常见的几种语音降噪 ...
出任意类型的分布? AI大语音:不仅GMM可以,只要性质不太奇怪的混合模型一般都能近似任意分布。这个 ...
参考 1、语音增强,2017年12月发表,偏基础概述:https://blog.csdn.net/zhanglu_wind/article/details/78700393?locationNum=8&fps=1 2、RNNoise,2017年9月发表,深度学习用于噪声抑制 ...
Tacotron模型架构图 (1) 下载tacotron模型的实现到本地,这里是基于GitHub上一个tacotron模型的实现开展研究的,GitHub网址:https://github.com/keithito/tacotron,由于 谷歌没有给出tacotron模型的官方实现 ...
EM算法有很多的应用: 最广泛的就是GMM混合高斯模型、聚类、HMM等等. The EM Algorithm 高斯混合模型(Mixtures of Gaussians)和EM算法 EM算法 求最大似然函数估计值的一般步骤: (1)写出似然函数; (2)对似然函数取对数,并整理 ...
博主最近转战语音增强研究,刚学习了最基础也是最成熟的方法——谱减法,最早是boll提出的《Suppression of acousic noise in speech using spectral subtraction》。http://blog.csdn.net/leixiaohua1020 ...