原文:PocketSphinx语音识别系统语言模型的训练和声学模型的改进

PocketSphinx语音识别系统语言模型的训练和声学模型的改进 zouxy qq.com http: blog.csdn.net zouxy 关于语音识别的基础知识和sphinx的知识,详细能够參考我的另外两篇博文: 语音识别的基础知识与CMUsphinx介绍: http: blog.csdn.net zouxy article details PocketSphinx语音识别系统的编译 安 ...

2015-05-19 14:19 0 8640 推荐指数:

查看详情

声学模型算法总结 2016 年语音识别的重大进步丨硬创公开课

https://zhuanlan.zhihu.com/p/24979135 雷锋网按:在过去的一年中,语音识别再次取得非常大的突破。IBM、微软等多家机构相继推出了自己的 Deep CNN 模型,提升了语音识别的准确率;Residual/Highway 网络的提出使我们可以把神经网络训练 ...

Mon Mar 13 23:30:00 CST 2017 0 1803
【sphinx】中文声学模型训练

一 .使用CMUSphinx训练声学模型 CMUSphinx工具包中自带好几个高质量的声学模型。美语模型,法语,中文模型。这些模型是经过优化的,为了得到最佳的性能,大多数指令交互系统能直接用这些模型,甚至一些大词汇量的应用也能直接用他们。 除此之外,CMUSphinx提供了功能 ...

Fri Sep 18 02:59:00 CST 2015 0 4635
2-GMM-HMMs语音识别系统-训练

本文记录在传统的语音识别中,训练GMM-HMMs声学模型过程中的公式推导过程。 Outline GMM - 混合高斯模型 HMM – 隐马尔科夫模型 Forward-Backward Algorithm – 前向后向算法 首先假设这里的训练数据,都做 ...

Mon Apr 24 04:04:00 CST 2017 0 1649
AI大语音(八)——GMM-HMM声学模型

基于GMM的0-9孤立词识别系统以词为训练单位,添加新词汇需要重新进行训练,若要涵盖所以词,差不多6万个词,训练量极大,预测时也要计算6万个模型的似然,哪个大预测出哪个,在实际应用中有局限性,只能应用于小词汇量场合。 孤立词识别系统识别了0-9 ...

Thu Sep 24 22:36:00 CST 2020 0 871
创建自己的语音识别系统

Data preparation Audio data 自己创建数据集: 10个不同的说话人 每个人说10句话 每句话包含3个词 总共300个词,(数字0~9) Task kaldi- ...

Sat Sep 09 01:40:00 CST 2017 0 1889
AI大语音(七)——基于GMM的0-9语音识别系统

点击上方“AI大道理”,选择“置顶”公众号 重磅干货,细致入微AI大道理 —————— 1 系统概要 孤立词识别语音中只包含一个单词的英文识别 识别对象:0-9以及o的英文语音 训练数据:330句话,每个字符30句话,11个字符 测试数据:110句话,每个字符10句话,11个字符 ...

Fri Aug 28 00:15:00 CST 2020 0 639
pocketsphinx库(离线语音识别

语音是一个连续的音频流,它是由大部分的稳定态和部分动态改变的状态混合构成。 语音识别系统本质上属于模式识别系统的范畴,都包含有特征提取和模板识别. 机器在识别匹配过程中,将输入语音信号的特征与模板库中的特征参数进行对比,根据所选建模方式,找出与之最为相近的模板参数,最终得到识别 ...

Sat Sep 07 21:10:00 CST 2019 0 989
传统声学模型之HMM和GMM

声学模型是指给定声学符号(音素)的情况下对音频特征建立的模型。 数学表达 用 \(X\) 表示音频特征向量 (观察向量),用 \(S\) 表示音素 (隐藏/内部状态),声学模型表示为 \(P(X|S)\)。 但我们的机器是个牙牙学语的孩子,并不知道哪个音素具体的发出的声音是怎么样的。我们只能 ...

Mon Jun 29 05:43:00 CST 2020 0 828
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM