原文:【sphinx】中文声学模型训练

一 .使用CMUSphinx训练声学模型 CMUSphinx工具包中自带好几个高质量的声学模型。美语模型,法语,中文模型。这些模型是经过优化的,为了得到最佳的性能,大多数指令交互系统能直接用这些模型,甚至一些大词汇量的应用也能直接用他们。 除此之外,CMUSphinx提供了功能,能适应现存的模型,为了满足有些需要更高精度的需求。当你需要使用不同的录音环境, 比如近距离,远离麦克分或者通过通话过程中 ...

2015-09-17 18:59 0 4635 推荐指数:

查看详情

传统声学模型之HMM和GMM

声学模型是指给定声学符号(音素)的情况下对音频特征建立的模型。 数学表达 用 \(X\) 表示音频特征向量 (观察向量),用 \(S\) 表示音素 (隐藏/内部状态),声学模型表示为 \(P(X|S)\)。 但我们的机器是个牙牙学语的孩子,并不知道哪个音素具体的发出的声音是怎么样的。我们只能 ...

Mon Jun 29 05:43:00 CST 2020 0 828
[sphinx]中文语言模型训练

一,不用分词的短词组语言模型训练 参考资源:http://cmusphinx.sourceforge.net/wiki/tutoriallm sphinx官方教程 1)文本准备 生成文本文件,内含一行一个的单词。头尾有<s> </s>标记,如下所示 ...

Wed Sep 16 01:21:00 CST 2015 0 1841
AI大语音(八)——GMM-HMM声学模型

基于GMM的0-9孤立词识别系统以词为训练单位,添加新词汇需要重新进行训练,若要涵盖所以词,差不多6万个词,训练量极大,预测时也要计算6万个模型的似然,哪个大预测出哪个,在实际应用中有局限性,只能应用于小词汇量场合。 孤立词识别系统识别了0-9 ...

Thu Sep 24 22:36:00 CST 2020 0 871
语音合成中声学模型在可控性上的努力

本文主要介绍3种模型,分别是前向注意力(Forward Attention,FA/FA+TA),逐步单向注意力(Stepwise Monotonic Attention,SMA)和FastSpeech2,前两者都是要求注意力权重尽量保证单调向前。具体来说,假设某一解码步上的注意力权重 ...

Mon Feb 01 19:17:00 CST 2021 1 351
声学模型算法总结 2016 年语音识别的重大进步丨硬创公开课

https://zhuanlan.zhihu.com/p/24979135 雷锋网按:在过去的一年中,语音识别再次取得非常大的突破。IBM、微软等多家机构相继推出了自己的 Deep CNN 模型,提升了语音识别的准确率;Residual/Highway 网络的提出使我们可以把神经网络训练 ...

Mon Mar 13 23:30:00 CST 2017 0 1803
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM