原文:Sphinx语音识别学习记录 (六)-我的目标和几个想像的方案(闲置中)

CMUSphinx系列目录 一开始只是因为英文比较差,看不懂没有字幕的公开课 然后想现在语音识别发展了那么久,能不能用语音识别先做出一套简陋的英文字幕,然后再通过google翻译 PS:别鄙视我 翻译出简陋的中文字幕。 然后我就来研究了一阵子,目前预想的流程方案是这样的 首先是提取语音和分割,语音提取应该可以用开源库FFMPEG,提取语音流 而且记得之前还看到过语音断句工具,再把之前的语音流断句 ...

2012-07-12 16:52 3 3739 推荐指数:

查看详情

Sphinx语音识别学习记录 (一)-基本运行测试

CMUSphinx系列目录 这一阵子因为个人的某个需求开始研究语音识别 找了一阵子之后决定选择研究下cmusphinx 下面是官方的介绍 http://cmusphinx.sourceforge.net/wiki/ 现在网上相关资料基本只有官方 ...

Thu Jun 21 18:27:00 CST 2012 2 6488
Sphinx语音识别学习记录 (五)-错误调试

CMUSphinx系列目录 如何解决使用别的声学模型的时候出现的问题 使用别人训练好的hmm模型的时候一直报以下错误(我这里使用的Communica ...

Sat Jun 23 01:41:00 CST 2012 1 4406
Sphinx语音识别学习记录 (三)-小范围语音英文识别

CMUSphinx系列目录 那我们该如何提高准确率呢? 根据第四章的分析,我们需要建立好一点的语音模型,而好一点的语音模型需要几个句子或者几个单词组合类型做出来的 因为我们统计的概率就是连续的单词,出现的概率和,出现某个单词后接着出现另外的单词的概率 ...

Thu Jul 12 17:10:00 CST 2012 1 4335
Sphinx语音识别学习记录 (四)-小范围语音中文识别

CMUSphinx系列目录 关于中文识别 网上很多都是学习自下面的博客,Sphinx武林秘籍(上) 但很多人照做之后纷纷表示识别不出来,我们猜测是某个参数设定错误或者版本变化导致的 http://www.cnblogs.com/huanghuang ...

Thu Jul 12 23:29:00 CST 2012 26 34940
IOS开发学习笔记(二) 语音识别

上次简单地讲解了如何利用科大讯飞完成语音合成,今天接着也把语音识别整理一下。当然,写代码前我们需要做的一些工作(如申请appid、导库),在上一篇语音合成的文章当中已经说过了,不了解的可以看看我上次的博文,那么这次直接从堆代码开始吧。 详细步骤: 1.导完类库之后,在工程里添加 ...

Sun Jul 20 16:45:00 CST 2014 13 3818
语音识别唤醒技术调研

上篇博客(语音识别传统方法(GMM+HMM+NGRAM)概述)说到我们team要做语音识别相关的项目,而我们公司的芯片是用在终端上的,即我们要做终端上的语音识别。由于目前终端(如手机)上的CPU还不足够强劲,不能让语音识别的各种算法跑在终端上,尤其现在语音识别都是基于深度学习来做了,更加不能跑 ...

Wed May 29 06:26:00 CST 2019 2 1883
语音识别-TDNN

近来在了解卷积神经网络(CNN),后来查到CNN是受语音信号处理时延神经网络(TDNN)影响而发明的。本篇的大部分内容都来自关于TDNN原始文献【1】的理解和整理。该文写与1989年,在识别"B", "D", "G"三个浊音得到98.5%的准确率,高于HMM的93.7%。是CNN的先驱 ...

Mon Jan 14 01:11:00 CST 2019 0 1274
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM