【文章推荐】AI大语音（八）——GMM-HMM声学模型

原文：AI大语音（八）——GMM-HMM声学模型

基于GMM的孤立词识别系统以词为训练单位，添加新词汇需要重新进行训练，若要涵盖所以词，差不多万个词，训练量极大，预测时也要计算万个模型的似然，哪个大预测出哪个，在实际应用中有局限性，只能应用于小词汇量场合。孤立词识别系统识别了的数字的英文单词，但是假如有人用英文报电话号码，是识别不了整个号码的，甚至识别不了其中的one。孤立词识别这个模型无法从一连串英文号码里面包含了one two ...

2020-09-24 14:36 0 871 推荐指数：

查看详情

传统声学模型之HMM和GMM

声学模型是指给定声学符号(音素)的情况下对音频特征建立的模型。数学表达用 \(X\) 表示音频特征向量 (观察向量)，用 \(S\) 表示音素 (隐藏/内部状态)，声学模型表示为 \(P(X|S)\)。但我们的机器是个牙牙学语的孩子，并不知道哪个音素具体的发出的声音是怎么样的。我们只能 ...

AI大语音（九）——基于GMM-HMM的连续语音识别系统

上一专题GMM-HMM声学模型中讲述了其理论知识，这一章利用理论搭建一套GMM-HMM系统，来识别连续0123456789的英文语音。本系统是单音素，未涉及后面三音子的训练以及决策树的内容。在GMM专题和HMM专题中分别讲述了其训练都是EM算法，那么融合形成GMM-HMM模型后会 ...

机器学习&数据挖掘笔记_14（GMM-HMM语音识别简单理解）

　　为了对GMM-HMM在语音识别上的应用有个宏观认识，花了些时间读了下HTK（用htk完成简单的孤立词识别）的部分源码，对该算法总算有了点大概认识，达到了预期我想要的。不得不说，网络上关于语音识别的通俗易懂教程太少，都是各种公式满天飞，很少有说具体细节的，当然了，那需要有实战经验才行 ...

AI大语音（六）——混合高斯模型（GMM）

出任意类型的分布？ AI大语音：不仅GMM可以，只要性质不太奇怪的混合模型一般都能近似任意分布。这个 ...

PocketSphinx语音识别系统语言模型的训练和声学模型的改进

PocketSphinx语音识别系统语言模型的训练和声学模型的改进 zouxy09@qq.com http://blog.csdn.net/zouxy09 关于语音识别的基础知识和sphinx的知识，详细能够參考我的另外两篇博文：语音识别的基础知识 ...

语音合成中声学模型在可控性上的努力

本文主要介绍3种模型，分别是前向注意力（Forward Attention，FA/FA+TA），逐步单向注意力（Stepwise Monotonic Attention，SMA）和FastSpeech2，前两者都是要求注意力权重尽量保证单调向前。具体来说，假设某一解码步上的注意力权重 ...

【sphinx】中文声学模型训练

一 .使用CMUSphinx训练声学模型 CMUSphinx工具包中自带好几个高质量的声学模型。美语模型，法语，中文模型。这些模型是经过优化的，为了得到最佳的性能，大多数指令交互系统能直接用这些模型，甚至一些大词汇量的应用也能直接用他们。除此之外，CMUSphinx提供了功能 ...

从声学模型算法总结 2016 年语音识别的重大进步丨硬创公开课

https://zhuanlan.zhihu.com/p/24979135 雷锋网按：在过去的一年中，语音识别再次取得非常大的突破。IBM、微软等多家机构相继推出了自己的 Deep CNN 模型，提升了语音识别的准确率；Residual/Highway 网络的提出使我们可以把神经网络训练 ...

原文：AI大语音（八）——GMM-HMM声学模型

相关推荐

相关标签