原文:語音識別算法閱讀之RNN-T-2013

論文: RNNT:SPEECH RECOGNITION WITH DEEP RECURRENT NEURAL NETWORKS, LSTM結構: 多層雙向LSTM結構: 思想: CTC對於當前時刻的輸出只與當前時刻輸入有關p k t ,而RNN T引入語音學的信息,不僅與當前時刻輸入有關,還有歷史的輸出有關p k t,u 即RNN T的兩個網絡輸出,一個是CTC輸出激活,另一個語言學預測模型輸出 ...

2020-09-15 22:14 0 981 推薦指數:

查看詳情

語音識別算法閱讀之EESEN

論文:   EESEN:END-TO-END SPEECH RECOGNITION USING DEEP RNN MODELS AND WFST-BASED DECODING 現狀: 混合DNN仍然GMM為其提供初始化的幀對齊,需要迭代訓練強制對齊 ...

Wed Sep 16 07:06:00 CST 2020 0 770
語音識別算法閱讀之CTC

論文:   CTC:Connectionist Temporal Classification: Labelling Unsegmented Sequence Data with Recurrent Neural Networks 思想:   語音識別中,一般包含語音 ...

Sun Sep 13 23:36:00 CST 2020 0 752
語音識別算法閱讀之DFSMN

論文: Deep-FSMN for Large Vocabulary Continuous Speech Recognition 思想:   對於大詞匯量語音識別,往往需要更深的網絡結構,但是當FSMN[1]或cFSMN[2]的結構很深時容易引發剃度消失和爆炸問題 ...

Thu Sep 17 05:51:00 CST 2020 0 863
語音識別算法閱讀之LAS

LAS:   listen, attented and spell,Google 思想:   sequence to sequence的思想,模型分為encoder和dec ...

Mon Sep 14 00:00:00 CST 2020 0 883
語音識別:從 WaveNet 到 Tacotron,再到 RNN-T

從 WaveNet 到 Tacotron,再到 RNN-T 谷歌再獲語音識別新進展:利用序列轉導來實現多人語音識別和說話人分類 雷鋒網 AI 科技評論按:從 WaveNet 到 Tacotron,再到 RNN-T,谷歌一直站在語音人工智能技術的最前沿。近日,他們又將多人語音識別和說話人分類問題 ...

Wed Aug 28 21:18:00 CST 2019 0 527
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM