前面的文章(语音降噪论文“A Hybrid Approach for Speech Enhancement Using MoG Model and Neural Network Phoneme Classifier”的研读 )梳理了论文的思想。本篇就开始对其实践,主要分以下几步:1,基于一个语料库 ...
上篇文章 基于混合模型的语音降噪实践 实践了基于混合模型的算法来做语音降噪,有了一定的降噪效果。本篇说说怎么样来提升降噪效果。 算法里会算每个音素的高斯模型参数,也会建一个音素分类的神经网络模型。这些都是依赖于音素对齐的,音素对齐做的越好,每个音素的高斯模型越准确,音素分类模型越收敛准确率越高,从而算法的降噪效果越好。先前做音素对齐用的是开源工具speech aligner,怎么样让音素对齐做的更 ...
2021-07-19 08:03 0 276 推荐指数:
前面的文章(语音降噪论文“A Hybrid Approach for Speech Enhancement Using MoG Model and Neural Network Phoneme Classifier”的研读 )梳理了论文的思想。本篇就开始对其实践,主要分以下几步:1,基于一个语料库 ...
当前基于深度学习的语音降噪方法主要分为两个类: 基于TF时频域的方法 (有两大类:基于mask和非基于mask的方法) 基于时域的方法,就我自己的实验结果来说,基于时域的方法比基于TFmask的方法要差一些,可能这样方法的trick更多一些吧。 基于时频域方法中 ...
出任意类型的分布? AI大语音:不仅GMM可以,只要性质不太奇怪的混合模型一般都能近似任意分布。这个 ...
参考 1、语音增强,2017年12月发表,偏基础概述:https://blog.csdn.net/zhanglu_wind/article/details/78700393?locationNum=8&fps=1 2、RNNoise,2017年9月发表,深度学习用于噪声抑制 ...
博主最近转战语音增强研究,刚学习了最基础也是最成熟的方法——谱减法,最早是boll提出的《Suppression of acousic noise in speech using spectral subtraction》。http://blog.csdn.net/leixiaohua1020 ...
前面的几篇文章讲了webRTC中的语音降噪。最近又用到了基于MCRA-OMLSA的语音降噪,就学习了原理并且软件实现了它。MCRA主要用于噪声估计,OMLSA是基于估计出来的噪声去做降噪。类比于webRTC中的降噪方法,也有噪声估计(分位数噪声估计法)和基于估计出来的噪声降噪(维纳滤波),MCRA ...
噪声问题一直是语音识别的一个老大难的问题,在理想的实验室的环境下,识别效果已经非常好了,之前听很多音频算法工程师抱怨,在给识别做降噪时,经常发现WER不降反升,降低了识别率,有点莫名其妙,又无处下手。 刚好,前段时间调到了AIlab部门,有机会接触这块,改善语音识别的噪声问题,虽然在 ...
一.处理源语音 1.定位: 2.仿造load_preprocess_wav()函数读入音频 3.新建enhance.py文件,主要使用减谱法和自适应滤波器法,代码如下: 4.在__init__.py文件中调用enhance() 二.处理生成语音 1.定位:我选择在UI界面中 ...