原文:深度學習與人類語言處理-語音識別(part2)

上節回顧深度學習與人類語言處理 語音識別 part ,這節課我們將學習如何將seq seq模型用在語音識別 LAS 那我們來看看LAS的Encoder,Attend,Decoder分別是什么 Listen Listen是一個典型的Encoder結構,輸入為聲學特征 x ,x ,...,x T ,輸出和輸入長度相同,是對聲學特征的高階表示, h ,h ,...,h T . 我們希望Encoder可以 ...

2020-03-18 10:51 0 1378 推薦指數:

查看詳情

深度學習與人類語言處理-語音識別(part3)

上節回顧深度學習與人類語言處理-語音識別(part2),這節課我們接着看seq2seq模型怎么做語音識別 上節課我們知道LAS做語音識別需要看完一個完整的序列才能輸出,把我們希望語音識別模型可以在聽到聲音的時候就進行輸出,一個直觀的想法就是用單向的RNN,我們來看看CTC是怎么做 ...

Sat Mar 21 18:23:00 CST 2020 0 1502
深度學習與人類語言處理-語音識別(part1)

深度學習與人類語言處理課程筆記,上節回顧深度學習與人類語言處理-introduction。這節課將會簡單介紹語音識別的最新研究方法,請看正文 語音識別該何去何從? 1969年,J.R. PIERCE:“語音識別就像把水變成汽油、從大海中淘金、治療癌症、人類登陸月球” 當然,這是 ...

Sun Mar 15 17:35:00 CST 2020 0 2191
深度學習與人類語言處理-introduction

深度學習與人類語言處理(Deep learning for Human Language Processing) 李宏毅老師深度學習與人類語言處理課程筆記,請看正文 這門課會學到什么? 為什么叫人類語言處理呢? 現在大家熟知的基本都是自然語言處理,那什么是自然語言 ...

Fri Mar 13 20:06:00 CST 2020 1 1115
基於深度學習的中文語音識別系統框架(pluse)

本文搭建一個完整的中文語音識別系統,包括聲學模型和語言模型,能夠將輸入的音頻信號識別為漢字。 聲學模型使用了應用較為廣泛的遞歸循環網絡中的GRU-CTC的組合,除此之外還引入了科大訊飛提出的DFCNN深度全序列卷積神經網絡,也將引入阿里的架構DFSMN。 語言模型有傳統n-gram模型 ...

Sun Sep 09 22:50:00 CST 2018 0 2261
基於深度學習的中文語音識別系統

最近看到一個開源項目,特地學習了下,實測后,語音識別系統的正確率大概75%左右,作為學習入門的資料還是不錯的,項目已上傳到github上,不過數據集和生成的模型由於文件太大,上傳失敗,隨后存在百度網盤,自行下載哈,普通電腦真傷,跑了三天,還是gpu快點。 查看本項目的Wiki文檔 如果程序運行 ...

Mon Dec 23 18:02:00 CST 2019 0 1311
python深度學習語音識別(CPU vs GPU)

訓練時間 在mbp的i5的cpu上訓練了3輪,花的時間如下 kaggle gpu telsa 對比gpu和cpu,時間相差了1,2個數量級 GeForce GTX 1080 在本 ...

Fri Jul 19 18:21:00 CST 2019 0 405
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM