一、语音产生的声学理论 *我们可以有条件的将人的发声看作是两个过程: 1.产生声源(准周期气流脉冲或白噪声)去激励声道 2.声道对声源的调制作用 *我们将把重点放在研究: 1.声道是怎样对声源调制的 2.为什么不同的声道形状会产生不同的声音 ...
转眼间,已经工作了九个月,从一开始公司的忙碌到压力,再到如今暂时的稳定,空了就想起了当初申请博客园的初衷,分享创造进步。 出于很多的机缘,接触语音相关知识,工作九个月,都是在围绕着语音信号处理展开,比如回声消除 噪声抑制 网络丢包补偿等工作。 想想总结还是先从最基本的开始,先从基本的语音模型开始博客园之旅。 语音生成系统 人的发音系统的器官,主要有:声道和声带。 声道:从声带到嘴唇的呼吸通道,声音 ...
2013-03-18 23:23 0 3080 推荐指数:
一、语音产生的声学理论 *我们可以有条件的将人的发声看作是两个过程: 1.产生声源(准周期气流脉冲或白噪声)去激励声道 2.声道对声源的调制作用 *我们将把重点放在研究: 1.声道是怎样对声源调制的 2.为什么不同的声道形状会产生不同的声音 ...
前面的文章(语音降噪论文“A Hybrid Approach for Speech Enhancement Using MoG Model and Neural Network Phoneme Classifier”的研读 )梳理了论文的思想。本篇就开始对其实践,主要分以下几步:1,基于一个语料库 ...
论文: CLDNN: CONVOLUTIONAL, LONG SHORT-TERM MEMORY,FULLY CONNECTED DEEP NEURAL NETWORKS,Google ...
一.下载训练好的模型 下载路径:http://kaldi-asr.org/models/m2 二.上传&配置 1.上传到kaldi/egs/目录下 2.解压,tar -zxvf 0002_cvte_chain_model_v2.tar.gz ...
当前基于深度学习的语音降噪方法主要分为两个类: 基于TF时频域的方法 (有两大类:基于mask和非基于mask的方法) 基于时域的方法,就我自己的实验结果来说,基于时域的方法比基于TFmask的方法要差一些,可能这样方法的trick更多一些吧。 基于时频域方法中 ...
Tacotron模型架构图 (1) 下载tacotron模型的实现到本地,这里是基于GitHub上一个tacotron模型的实现开展研究的,GitHub网址:https://github.com/keithito/tacotron,由于 谷歌没有给出tacotron模型的官方实现 ...
上篇文章(基于混合模型的语音降噪实践)实践了基于混合模型的算法来做语音降噪,有了一定的降噪效果。本篇说说怎么样来提升降噪效果。 算法里会算每个音素的高斯模型参数,也会建一个音素分类的神经网络模型。这些都是依赖于音素对齐的,音素对齐做的越好,每个音素的高斯模型越准确,音素分类模型越收敛准确率 ...
出任意类型的分布? AI大语音:不仅GMM可以,只要性质不太奇怪的混合模型一般都能近似任意分布。这个 ...