原文:語音識別算法閱讀之transformer-transducer(facebook)

論文: TRANSFORMER TRANSDUCER:END TO END SPEECH RECOGNITION WITH SELF ATTENTION 思想: 借助RNN T在語音識別上的優勢,通過tranformer替換RNN T中的RNN結構,實現並行化運算,加快訓練過程 encoder部分前段引入包含因果卷積的VGGNet,一方面縮短聲學特征的時序長度,節約計算,另一方面融合上下文信息 ...

2020-09-16 22:58 0 1449 推薦指數:

查看詳情

語音識別與 RNN-Transducer 概述

注:本文為一次課程展示所用幻燈片與報告存檔。 目錄 背景 方法綜述 RNN-Transducer 發展背景 模型結構 算法實現 后記 背景 語音識別是一項可以使人與人、人與機器更加順暢地交流的技術。近年 ...

Tue Oct 19 18:55:00 CST 2021 0 256
語音識別算法閱讀之DFSMN

論文: Deep-FSMN for Large Vocabulary Continuous Speech Recognition 思想:   對於大詞匯量語音識別,往往需要更深的網絡結構,但是當FSMN[1]或cFSMN[2]的結構很深時容易引發剃度消失和爆炸問題 ...

Thu Sep 17 05:51:00 CST 2020 0 863
語音識別算法閱讀之speechTransformer

論文:   SPEECH-TRANSFORMER: A NO-RECURRENCE SEQUENCE-TO-SEQUENCE MODELFOR SPEECH RECOGNITION 思路:   1)整體采用seq2seq的encoder和decoder架構 ...

Thu Sep 17 06:14:00 CST 2020 0 2294
語音識別算法閱讀之LAS

LAS:   listen, attented and spell,Google 思想:   sequence to sequence的思想,模型分為encoder和dec ...

Mon Sep 14 00:00:00 CST 2020 0 883
語音識別算法閱讀之EESEN

論文:   EESEN:END-TO-END SPEECH RECOGNITION USING DEEP RNN MODELS AND WFST-BASED DECODING ...

Wed Sep 16 07:06:00 CST 2020 0 770
語音識別算法閱讀之CTC

論文:   CTC:Connectionist Temporal Classification: Labelling Unsegmented Sequence Data with Recurrent Neural Networks 思想:   語音識別中,一般包含語音 ...

Sun Sep 13 23:36:00 CST 2020 0 752
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM