CMUSphinx系列目录 这一阵子因为个人的某个需求开始研究语音识别 找了一阵子之后决定选择研究下cmusphinx 下面是官方的介绍 http://cmusphinx.sourceforge.net/wiki/ 现在网上相关资料基本只有官方 ...
CMUSphinx系列目录 一开始只是因为英文比较差,看不懂没有字幕的公开课 然后想现在语音识别发展了那么久,能不能用语音识别先做出一套简陋的英文字幕,然后再通过google翻译 PS:别鄙视我 翻译出简陋的中文字幕。 然后我就来研究了一阵子,目前预想的流程方案是这样的 首先是提取语音和分割,语音提取应该可以用开源库FFMPEG,提取语音流 而且记得之前还看到过语音断句工具,再把之前的语音流断句 ...
2012-07-12 16:52 3 3739 推荐指数:
CMUSphinx系列目录 这一阵子因为个人的某个需求开始研究语音识别 找了一阵子之后决定选择研究下cmusphinx 下面是官方的介绍 http://cmusphinx.sourceforge.net/wiki/ 现在网上相关资料基本只有官方 ...
CMUSphinx系列目录 如何解决使用别的声学模型的时候出现的问题 使用别人训练好的hmm模型的时候一直报以下错误(我这里使用的Communica ...
CMUSphinx系列目录 那我们该如何提高准确率呢? 根据第四章的分析,我们需要建立好一点的语音模型,而好一点的语音模型需要几个句子或者几个单词组合类型做出来的 因为我们统计的概率就是连续的单词,出现的概率和,出现某个单词后接着出现另外的单词的概率 ...
CMUSphinx系列目录 关于中文识别 网上很多都是学习自下面的博客,Sphinx武林秘籍(上) 但很多人照做之后纷纷表示识别不出来,我们猜测是某个参数设定错误或者版本变化导致的 http://www.cnblogs.com/huanghuang ...
书 sphinx语音识别其实是基于统计语言模型的它主要靠language model(lm),Hidden Mar ...
上次简单地讲解了如何利用科大讯飞完成语音合成,今天接着也把语音识别整理一下。当然,写代码前我们需要做的一些工作(如申请appid、导库),在上一篇语音合成的文章当中已经说过了,不了解的可以看看我上次的博文,那么这次直接从堆代码开始吧。 详细步骤: 1.导完类库之后,在工程里添加 ...
上篇博客(语音识别传统方法(GMM+HMM+NGRAM)概述)说到我们team要做语音识别相关的项目,而我们公司的芯片是用在终端上的,即我们要做终端上的语音识别。由于目前终端(如手机)上的CPU还不足够强劲,不能让语音识别的各种算法跑在终端上,尤其现在语音识别都是基于深度学习来做了,更加不能跑 ...
近来在了解卷积神经网络(CNN),后来查到CNN是受语音信号处理中时延神经网络(TDNN)影响而发明的。本篇的大部分内容都来自关于TDNN原始文献【1】的理解和整理。该文写与1989年,在识别"B", "D", "G"三个浊音中得到98.5%的准确率,高于HMM的93.7%。是CNN的先驱 ...