原文:AI大語音(十三)——DNN-HMM (深度解析)

本文來自公眾號 AI大道理 GMM HMM建模能力有限,無法准確的表征語音內部復雜的結構,所以識別率低。 隨着深度學習的崛起,研究人員將其逐步應用於語音識別中。 最開始便是DNN代替了GMM來進行觀察狀態概率的輸出,實現DNN HMM聲學模型框架,大大提高了識別率。 GMM HMM與DNN HMM對比 DNN HMM用DNN替換了GMM來對輸入語音信號的觀察概率進行建模。GMM對HMM中的后驗概率 ...

2020-11-23 22:39 0 435 推薦指數:

查看詳情

基於DNN-HMM語音識別技術

基於DNN-HMM語音識別聲學模型結構如下圖所示,與傳統的基於GMM-HMM的聲學模型相比,唯一不同點在於用DNN替換了GMM來對輸入語音信號的觀察概率進行建模。DNN與GMM相比具有如下優點: DNN不需要對聲學特征所服從的分布進行假設; DNN的輸入可以采用連續的拼接幀 ...

Sun Aug 11 01:52:00 CST 2019 0 2506
AI語音(十一)——WFST解碼器(上)(深度解析

點擊上方“AI大道理”,選擇“置頂”公眾號 為了讓識別出來的語音符合常規語言表達,引入了語言模型作為約束。 為了加速解碼識別效率又引入了WFST解碼機制。 解碼本質:解碼就是在網絡中尋找最優路徑。 ​解碼方式多種多樣,各有優缺點。 ​ (注:on-the-fly ...

Wed Nov 18 07:35:00 CST 2020 0 479
AI語音(五)——隱馬爾科夫模型(HMM

​點擊上方“AI大道理”,選擇“置頂”公眾號 重磅干貨,細致入微AI大道理 —————— 1HMM基礎 一模型、兩假設、三問題 1)一個模型 隨機過程:是依賴於參數的一組隨機變量的全體,參數通常是時間。隨機變量是隨機現象的數量表現,其取值隨着偶然因素的影響而改變。 例如,某商店在從 ...

Thu Aug 20 09:09:00 CST 2020 0 567
AI語音(八)——GMM-HMM聲學模型

基於GMM的0-9孤立詞識別系統以詞為訓練單位,添加新詞匯需要重新進行訓練,若要涵蓋所以詞,差不多6萬個詞,訓練量極大,預測時也要計算6萬個模型的似然,哪個大預測出哪個,在實際應 ...

Thu Sep 24 22:36:00 CST 2020 0 871
AI語音(十)——N-gram語言模型(深度解析

掃描下方“AI大道理”,選擇“關注”公眾號 上一專題搭建了一套GMM-HMM系統,來識別連續0123456789的英文語音。但若不是僅針對數字,而是所有普通詞匯,可能達到十幾萬個詞,解碼過程將非常復雜,識別結果組合太多,識別結果不會理想。因此只有聲學模型是完全不夠的,需要引入語言模型來約束識別 ...

Thu Oct 15 00:21:00 CST 2020 0 635
AI語音(九)——基於GMM-HMM的連續語音識別系統

上一專題GMM-HMM聲學模型中講述了其理論知識,這一章利用理論搭建一套GMM-HMM系統,來識別連續0123456789的英文語音。 本系統是單音素,未涉及后面三音子的訓練以及決策樹的內容。 在GMM專題和HMM專題中分別講述了其訓練都是EM算法,那么融合形成GMM-HMM模型后會 ...

Mon Oct 05 00:54:00 CST 2020 0 686
智能語音技術的深度解析

歡迎大家前往騰訊雲+社區,獲取更多騰訊海量技術實踐干貨哦~ 本文由騰訊雲AI中心發表於雲+社區專欄 廣義上來講智能語音技術有各種各樣的定義,以上是常見的一些熱門的場景。語音識別,剛才羅老師也分享了部分內容。語音合成是文字變成語音,這部分我們后面會詳細展開。再往后看,聲紋識別 ...

Mon Nov 05 19:43:00 CST 2018 0 1562
語音識別的前世今生:GMM+HMM & 深度學習》講座筆記

這是我4月份在BitTiger公開課聽的王贇大牛《語音識別的前世今生》整理的筆記 ,本來打算整理通暢再發的,結果實在沒時間就一拖再拖。筆記有些草率,不過應該可以看明白,希望可以對有用,也祝王贇大神好 ...

Fri Jun 02 00:49:00 CST 2017 0 2106
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM