原文:基于深度学习的中文语音识别系统框架(pluse)

本文搭建一个完整的中文语音识别系统,包括声学模型和语言模型,能够将输入的音频信号识别为汉字。 声学模型使用了应用较为广泛的递归循环网络中的GRU CTC的组合,除此之外还引入了科大讯飞提出的DFCNN深度全序列卷积神经网络,也将引入阿里的架构DFSMN。 语言模型有传统n gram模型和基于深度神经网络的CBHG网络结构,该结构是谷歌用于TTS任务中的tacotron系统,本文中将该系统部分结构移 ...

2018-09-09 14:50 0 2261 推荐指数:

查看详情

基于深度学习中文语音识别系统

最近看到一个开源项目,特地学习了下,实测后,语音识别系统的正确率大概75%左右,作为学习入门的资料还是不错的,项目已上传到github上,不过数据集和生成的模型由于文件太大,上传失败,随后存在百度网盘,自行下载哈,普通电脑真伤,跑了三天,还是gpu快点。 查看本项目的Wiki文档 如果程序运行 ...

Mon Dec 23 18:02:00 CST 2019 0 1311
我们基于kaldi开发的嵌入式语音识别系统升级成深度学习

先前的文章《三个小白是如何在三个月内搭一个基于kaldi的嵌入式在线语音识别系统的 》说我们花了不到三个月的时间搭了一个基于kaldi的嵌入式语音识别系统,不过它是基于传统的GMM-HMM的,是给我们练手用的,通过搭这个系统我们累积了一定的语音识别领域的经验,接下来我们就要考虑做什么形态的产品 ...

Mon Dec 30 16:09:00 CST 2019 0 1807
1-GMM-HMMs语音识别系统-框架

本文主要对基于GMM/HMMs的传统语音识别系统做一个整体介绍。 Outline: 识别原理 统计学模型 系统框架 首先需要说明本文讨论的对象是连续语音识别(Continuous Speech Recognition, CSR),意味着基于DTW(动态时间规整)的孤立词识别 ...

Sun May 07 04:26:00 CST 2017 0 2480
创建自己的语音识别系统

Data preparation Audio data 自己创建数据集: 10个不同的说话人 每个人说10句话 每句话包含3个词 总共300个词,(数字0~9) Task kaldi- ...

Sat Sep 09 01:40:00 CST 2017 0 1889
AI大语音(七)——基于GMM的0-9语音识别系统

点击上方“AI大道理”,选择“置顶”公众号 重磅干货,细致入微AI大道理 —————— 1 系统概要 孤立词识别语音中只包含一个单词的英文识别 识别对象:0-9以及o的英文语音 训练数据:330句话,每个字符30句话,11个字符 测试数据:110句话,每个字符10句话,11个字符 ...

Fri Aug 28 00:15:00 CST 2020 0 639
人工智能语音识别系统开发

1.初始教程 1.登录百度云管理中心,点击管理控制台 2.进入后,下拉在已开通服务中选择百度语音 3.点击创建应用,得到以下应用 4.这里也可以查看它的相关技术文档 快速入门链接 2.文字合成语音 1.安装使用Python SDK,终端下: 技术 ...

Thu Sep 13 01:24:00 CST 2018 1 4366
2-GMM-HMMs语音识别系统-训练篇

本文记录在传统的语音识别中,训练GMM-HMMs声学模型过程中的公式推导过程。 Outline GMM - 混合高斯模型 HMM – 隐马尔科夫模型 Forward-Backward Algorithm – 前向后向算法 首先假设这里的训练数据,都做 ...

Mon Apr 24 04:04:00 CST 2017 0 1649
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM