原文:AI大语音(十三)——DNN-HMM (深度解析)

本文来自公众号 AI大道理 GMM HMM建模能力有限,无法准确的表征语音内部复杂的结构,所以识别率低。 随着深度学习的崛起,研究人员将其逐步应用于语音识别中。 最开始便是DNN代替了GMM来进行观察状态概率的输出,实现DNN HMM声学模型框架,大大提高了识别率。 GMM HMM与DNN HMM对比 DNN HMM用DNN替换了GMM来对输入语音信号的观察概率进行建模。GMM对HMM中的后验概率 ...

2020-11-23 22:39 0 435 推荐指数:

查看详情

基于DNN-HMM语音识别技术

基于DNN-HMM语音识别声学模型结构如下图所示,与传统的基于GMM-HMM的声学模型相比,唯一不同点在于用DNN替换了GMM来对输入语音信号的观察概率进行建模。DNN与GMM相比具有如下优点: DNN不需要对声学特征所服从的分布进行假设; DNN的输入可以采用连续的拼接帧 ...

Sun Aug 11 01:52:00 CST 2019 0 2506
AI语音(十一)——WFST解码器(上)(深度解析

点击上方“AI大道理”,选择“置顶”公众号 为了让识别出来的语音符合常规语言表达,引入了语言模型作为约束。 为了加速解码识别效率又引入了WFST解码机制。 解码本质:解码就是在网络中寻找最优路径。 ​解码方式多种多样,各有优缺点。 ​ (注:on-the-fly ...

Wed Nov 18 07:35:00 CST 2020 0 479
AI语音(五)——隐马尔科夫模型(HMM

​点击上方“AI大道理”,选择“置顶”公众号 重磅干货,细致入微AI大道理 —————— 1HMM基础 一模型、两假设、三问题 1)一个模型 随机过程:是依赖于参数的一组随机变量的全体,参数通常是时间。随机变量是随机现象的数量表现,其取值随着偶然因素的影响而改变。 例如,某商店在从 ...

Thu Aug 20 09:09:00 CST 2020 0 567
AI语音(八)——GMM-HMM声学模型

基于GMM的0-9孤立词识别系统以词为训练单位,添加新词汇需要重新进行训练,若要涵盖所以词,差不多6万个词,训练量极大,预测时也要计算6万个模型的似然,哪个大预测出哪个,在实际应 ...

Thu Sep 24 22:36:00 CST 2020 0 871
AI语音(十)——N-gram语言模型(深度解析

扫描下方“AI大道理”,选择“关注”公众号 上一专题搭建了一套GMM-HMM系统,来识别连续0123456789的英文语音。但若不是仅针对数字,而是所有普通词汇,可能达到十几万个词,解码过程将非常复杂,识别结果组合太多,识别结果不会理想。因此只有声学模型是完全不够的,需要引入语言模型来约束识别 ...

Thu Oct 15 00:21:00 CST 2020 0 635
AI语音(九)——基于GMM-HMM的连续语音识别系统

上一专题GMM-HMM声学模型中讲述了其理论知识,这一章利用理论搭建一套GMM-HMM系统,来识别连续0123456789的英文语音。 本系统是单音素,未涉及后面三音子的训练以及决策树的内容。 在GMM专题和HMM专题中分别讲述了其训练都是EM算法,那么融合形成GMM-HMM模型后会 ...

Mon Oct 05 00:54:00 CST 2020 0 686
智能语音技术的深度解析

欢迎大家前往腾讯云+社区,获取更多腾讯海量技术实践干货哦~ 本文由腾讯云AI中心发表于云+社区专栏 广义上来讲智能语音技术有各种各样的定义,以上是常见的一些热门的场景。语音识别,刚才罗老师也分享了部分内容。语音合成是文字变成语音,这部分我们后面会详细展开。再往后看,声纹识别 ...

Mon Nov 05 19:43:00 CST 2018 0 1562
语音识别的前世今生:GMM+HMM & 深度学习》讲座笔记

这是我4月份在BitTiger公开课听的王赟大牛《语音识别的前世今生》整理的笔记 ,本来打算整理通畅再发的,结果实在没时间就一拖再拖。笔记有些草率,不过应该可以看明白,希望可以对有用,也祝王赟大神好 ...

Fri Jun 02 00:49:00 CST 2017 0 2106
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM