【文章推荐】传统声学模型之HMM和GMM

原文：传统声学模型之HMM和GMM

声学模型是指给定声学符号音素的情况下对音频特征建立的模型。数学表达用 X 表示音频特征向量观察向量，用 S 表示音素隐藏内部状态，声学模型表示为 P X S 。但我们的机器是个牙牙学语的孩子，并不知道哪个音素具体的发出的声音是怎么样的。我们只能通过大量的数据去教他，比如说在拼音的时候对应鹅的发音，而这个过程就是 GMM 所做的，根据数据建立起这个拼音对应的音频特征分布， ...

2020-06-28 21:43 0 828 推荐指数：

查看详情

AI大语音（八）——GMM-HMM声学模型

基于GMM的0-9孤立词识别系统以词为训练单位，添加新词汇需要重新进行训练，若要涵盖所以词，差不多6万个词，训练量极大，预测时也要计算6万个模型的似然，哪个大预测出哪个，在实际应用中有局限性，只能应用于小词汇量场合。孤立词识别系统识别了0-9 ...

【sphinx】中文声学模型训练

一 .使用CMUSphinx训练声学模型 CMUSphinx工具包中自带好几个高质量的声学模型。美语模型，法语，中文模型。这些模型是经过优化的，为了得到最佳的性能，大多数指令交互系统能直接用这些模型，甚至一些大词汇量的应用也能直接用他们。除此之外，CMUSphinx提供了功能 ...

PocketSphinx语音识别系统语言模型的训练和声学模型的改进

PocketSphinx语音识别系统语言模型的训练和声学模型的改进 zouxy09@qq.com http://blog.csdn.net/zouxy09 关于语音识别的基础知识和sphinx的知识，详细能够參考我的另外两篇博文：语音识别的基础知识 ...

语音合成中声学模型在可控性上的努力

本文主要介绍3种模型，分别是前向注意力（Forward Attention，FA/FA+TA），逐步单向注意力（Stepwise Monotonic Attention，SMA）和FastSpeech2，前两者都是要求注意力权重尽量保证单调向前。具体来说，假设某一解码步上的注意力权重 ...

从声学模型算法总结 2016 年语音识别的重大进步丨硬创公开课

https://zhuanlan.zhihu.com/p/24979135 雷锋网按：在过去的一年中，语音识别再次取得非常大的突破。IBM、微软等多家机构相继推出了自己的 Deep CNN 模型，提升了语音识别的准确率；Residual/Highway 网络的提出使我们可以把神经网络训练 ...

语音识别传统方法(GMM+HMM+NGRAM)概述

春节后到现在近两个月了，没有更新博客，主要是因为工作的关注点正从传统语音（语音通信）转向智能语音（语音识别）。部门起了个新项目，要用到语音识别（准备基于Kaldi来做）。我们之前做的传统音频已基本成熟，就开始关注在语音识别上了。对于我们来说，这是个全新的领域（虽然都是语音相关的，但是语音通信偏信 ...

隐马尔科夫模型用于语音识别的原理（HMM+GMM）

本文简明讲述GMM-HMM在语音识别上的原理，建模和测试过程。这篇blog只回答三个问题： 1. 什么是Hidden Markov Model？ HMM要解决的三个问题: 1) Likelihood 2) Decoding 3) Training 2. GMM是神马？怎样用GMM求某一 ...

高斯混合模型(GMM)

文章目录 1. 1. 高斯模型简介 1.1. 1.1. 单高斯模型 1.2. 1.2. 高斯混合模型 1.3. 1.3. 高斯混合模型与K-means异同 ...

原文：传统声学模型之HMM和GMM

相关推荐

相关标签