实时语音通信发展到今天,用户对通话语音质量提出了越来越高的要求。由于终端设备的多样性以及使用场景的差异,声音问题依然存在。传统的音频处理技术从声音信号本身出发,挖掘其时频特性,作出假设,建立物理模型,很多参数都需要人工进行精细化微调,比较费时费力。随着AI技术的发展,凭借着其强大的拟合能力 ...
作者:YeBobr 链接:https: www.zhihu.com question answer 来源:知乎 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。 最近在深度学习在语音增强中的应用最前沿的应该数GAN网络了吧,把生成器当做增强网络,用判别器区分干净语音和增强语音。主要有如下两篇论文: .SEGAN: Speech Enhancement Generative A ...
2018-12-08 16:08 0 1294 推荐指数:
实时语音通信发展到今天,用户对通话语音质量提出了越来越高的要求。由于终端设备的多样性以及使用场景的差异,声音问题依然存在。传统的音频处理技术从声音信号本身出发,挖掘其时频特性,作出假设,建立物理模型,很多参数都需要人工进行精细化微调,比较费时费力。随着AI技术的发展,凭借着其强大的拟合能力 ...
😃 传统的语音增强方法基于一些设定好的先验假设,但是这些先验假设存在一定的不合理之处。此外 ...
DDPG DDPG介绍2 ddpg输出的不是行为的概率, 而是具体的行为, 用于连续动作 (continuous action) 的预测 公式推导 推导 代码实现的gym的pendulum游 ...
PPO DPPO介绍 PPO实现 代码DPPO ...
深度学习系列 | 诺亚面向语音语义的深度学习研究进展 编者:本文来自华为诺亚方舟实验室资深专家刘晓华在携程技术中心主办的深度学习Meetup中的主题演讲,介绍了华为诺亚面向语音语义的深度学习进展。关注“携程技术中心”微信公号(ctriptech),可获知更多技术分享信息 ...
前面都是value based的方法,现在看一种直接预测动作的方法 Policy Based Policy Gradient 一个介绍 karpathy的博客 一个推导 下面的例子实现的 ...
在图像的深度学习中,为了丰富图像训练集,更好的提取图像特征,泛化模型(防止模型过拟合),一般都会对数据图像进行数据增强, 数据增强,常用的方式,就是旋转图像,剪切图像,改变图像色差,扭曲图像特征,改变图像尺寸大小,增强图像噪音(一般使用高斯噪音,盐椒噪音)等. 但是需要注意,不要加入 ...
数据增强的原理 在深度学习中,一般要求样本的数量要充足,样本数量越多,训练出来的模型效果越好,模型的泛化能力越强。但是实际中,样本数量不足或者样本质量不够好,这就要对样本做数据增强,来提高样本质量。 在图像分类任务中,对于输入的图像进行一些简单的平移、缩放、颜色变换等,不会影响图像 ...