原文:深度学习与人类语言处理-语音识别(part2)

上节回顾深度学习与人类语言处理 语音识别 part ,这节课我们将学习如何将seq seq模型用在语音识别 LAS 那我们来看看LAS的Encoder,Attend,Decoder分别是什么 Listen Listen是一个典型的Encoder结构,输入为声学特征 x ,x ,...,x T ,输出和输入长度相同,是对声学特征的高阶表示, h ,h ,...,h T . 我们希望Encoder可以 ...

2020-03-18 10:51 0 1378 推荐指数:

查看详情

深度学习与人类语言处理-语音识别(part3)

上节回顾深度学习与人类语言处理-语音识别(part2),这节课我们接着看seq2seq模型怎么做语音识别 上节课我们知道LAS做语音识别需要看完一个完整的序列才能输出,把我们希望语音识别模型可以在听到声音的时候就进行输出,一个直观的想法就是用单向的RNN,我们来看看CTC是怎么做 ...

Sat Mar 21 18:23:00 CST 2020 0 1502
深度学习与人类语言处理-语音识别(part1)

深度学习与人类语言处理课程笔记,上节回顾深度学习与人类语言处理-introduction。这节课将会简单介绍语音识别的最新研究方法,请看正文 语音识别该何去何从? 1969年,J.R. PIERCE:“语音识别就像把水变成汽油、从大海中淘金、治疗癌症、人类登陆月球” 当然,这是 ...

Sun Mar 15 17:35:00 CST 2020 0 2191
深度学习与人类语言处理-introduction

深度学习与人类语言处理(Deep learning for Human Language Processing) 李宏毅老师深度学习与人类语言处理课程笔记,请看正文 这门课会学到什么? 为什么叫人类语言处理呢? 现在大家熟知的基本都是自然语言处理,那什么是自然语言 ...

Fri Mar 13 20:06:00 CST 2020 1 1115
基于深度学习的中文语音识别系统框架(pluse)

本文搭建一个完整的中文语音识别系统,包括声学模型和语言模型,能够将输入的音频信号识别为汉字。 声学模型使用了应用较为广泛的递归循环网络中的GRU-CTC的组合,除此之外还引入了科大讯飞提出的DFCNN深度全序列卷积神经网络,也将引入阿里的架构DFSMN。 语言模型有传统n-gram模型 ...

Sun Sep 09 22:50:00 CST 2018 0 2261
基于深度学习的中文语音识别系统

最近看到一个开源项目,特地学习了下,实测后,语音识别系统的正确率大概75%左右,作为学习入门的资料还是不错的,项目已上传到github上,不过数据集和生成的模型由于文件太大,上传失败,随后存在百度网盘,自行下载哈,普通电脑真伤,跑了三天,还是gpu快点。 查看本项目的Wiki文档 如果程序运行 ...

Mon Dec 23 18:02:00 CST 2019 0 1311
python深度学习语音识别(CPU vs GPU)

训练时间 在mbp的i5的cpu上训练了3轮,花的时间如下 kaggle gpu telsa 对比gpu和cpu,时间相差了1,2个数量级 GeForce GTX 1080 在本 ...

Fri Jul 19 18:21:00 CST 2019 0 405
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM