原文:语音识别算法阅读之RNN-T-2018

论文: EXPLORING ARCHITECTURES, DATA AND UNITS FOR STREAMING END TO END SPEECH RECOGNITION WITH RNN TRANSDUCER, CTC的一个问题在于,其假设当前帧的输出与历史输出之间的条件独立性 RNN T引入预测网络来弥补CTC这种条件独立性假设带来的问题 思想: 针对CTC网络的条件独立性假设 当前时刻输 ...

2020-09-15 22:26 0 2315 推荐指数:

查看详情

语音识别算法阅读之EESEN

论文:   EESEN:END-TO-END SPEECH RECOGNITION USING DEEP RNN MODELS AND WFST-BASED DECODING 现状: 混合DNN仍然GMM为其提供初始化的帧对齐,需要迭代训练强制对齐 ...

Wed Sep 16 07:06:00 CST 2020 0 770
语音识别算法阅读之CTC

论文:   CTC:Connectionist Temporal Classification: Labelling Unsegmented Sequence Data with Recurrent Neural Networks 思想:   语音识别中,一般包含语音 ...

Sun Sep 13 23:36:00 CST 2020 0 752
语音识别算法阅读之DFSMN

论文: Deep-FSMN for Large Vocabulary Continuous Speech Recognition 思想:   对于大词汇量语音识别,往往需要更深的网络结构,但是当FSMN[1]或cFSMN[2]的结构很深时容易引发剃度消失和爆炸问题 ...

Thu Sep 17 05:51:00 CST 2020 0 863
语音识别算法阅读之LAS

LAS:   listen, attented and spell,Google 思想:   sequence to sequence的思想,模型分为encoder和dec ...

Mon Sep 14 00:00:00 CST 2020 0 883
语音识别:从 WaveNet 到 Tacotron,再到 RNN-T

从 WaveNet 到 Tacotron,再到 RNN-T 谷歌再获语音识别新进展:利用序列转导来实现多人语音识别和说话人分类 雷锋网 AI 科技评论按:从 WaveNet 到 Tacotron,再到 RNN-T,谷歌一直站在语音人工智能技术的最前沿。近日,他们又将多人语音识别和说话人分类问题 ...

Wed Aug 28 21:18:00 CST 2019 0 527
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM