【文章推荐】语音识别算法阅读之RNN-T-2018

原文：语音识别算法阅读之RNN-T-2018

论文： EXPLORING ARCHITECTURES, DATA AND UNITS FOR STREAMING END TO END SPEECH RECOGNITION WITH RNN TRANSDUCER, CTC的一个问题在于，其假设当前帧的输出与历史输出之间的条件独立性 RNN T引入预测网络来弥补CTC这种条件独立性假设带来的问题思想：针对CTC网络的条件独立性假设当前时刻输 ...

2020-09-15 22:26 0 2315 推荐指数：

查看详情

语音识别算法阅读之RNN-T-2013

：思想：　　CTC对于当前时刻的输出只与当前时刻输入有关p(k|t)，而RNN-T引 ...

语音识别算法阅读之EESEN

论文：　　EESEN:END-TO-END SPEECH RECOGNITION USING DEEP RNN MODELS AND WFST-BASED DECODING 现状：混合DNN仍然GMM为其提供初始化的帧对齐，需要迭代训练强制对齐 ...

语音识别算法阅读之CTC

论文：　　CTC：Connectionist Temporal Classification: Labelling Unsegmented Sequence Data with Recurrent Neural Networks 思想：　　语音识别中，一般包含语音 ...

语音识别算法阅读之DFSMN

论文： Deep-FSMN for Large Vocabulary Continuous Speech Recognition 思想：　　对于大词汇量语音识别，往往需要更深的网络结构，但是当FSMN[1]或cFSMN[2]的结构很深时容易引发剃度消失和爆炸问题 ...

语音识别算法阅读之speechTransformer

；　　2）借助transformer对文本位置信息进行学习；　　3）相对于RNN，transf ...

语音识别算法阅读之LAS

LAS: 　　listen, attented and spell,Google 思想: 　　sequence to sequence的思想，模型分为encoder和dec ...

语音识别：从 WaveNet 到 Tacotron，再到 RNN-T

从 WaveNet 到 Tacotron，再到 RNN-T 谷歌再获语音识别新进展：利用序列转导来实现多人语音识别和说话人分类雷锋网 AI 科技评论按：从 WaveNet 到 Tacotron，再到 RNN-T，谷歌一直站在语音人工智能技术的最前沿。近日，他们又将多人语音识别和说话人分类问题 ...

语音识别算法阅读之transformer-transducer(google)

论文：　　TRANSFORMER TRANSDUCER: A STREAMABLE SPEECH RECOGNITION MODELWITH TRANSFORMER ENCODERS AND RNN-T LOSS 思想：　　论文作者借助RNN-T的整体架构，利用 ...

原文：语音识别算法阅读之RNN-T-2018

相关推荐

相关标签