原文:AI大語音(八)——GMM-HMM聲學模型

基於GMM的 孤立詞識別系統以詞為訓練單位,添加新詞匯需要重新進行訓練,若要涵蓋所以詞,差不多 萬個詞,訓練量極大,預測時也要計算 萬個模型的似然,哪個大預測出哪個,在實際應用中有局限性,只能應用於小詞匯量場合。 孤立詞識別系統識別了 的數字的英文單詞,但是假如有人用英文報電話號碼,是識別不了整個號碼的,甚至識別不了其中的one。 孤立詞識別這個模型無法從一連串英文號碼 里面包含了one two ...

2020-09-24 14:36 0 871 推薦指數:

查看詳情

傳統聲學模型HMMGMM

聲學模型是指給定聲學符號(音素)的情況下對音頻特征建立的模型。 數學表達 用 \(X\) 表示音頻特征向量 (觀察向量),用 \(S\) 表示音素 (隱藏/內部狀態),聲學模型表示為 \(P(X|S)\)。 但我們的機器是個牙牙學語的孩子,並不知道哪個音素具體的發出的聲音是怎么樣的。我們只能 ...

Mon Jun 29 05:43:00 CST 2020 0 828
AI語音(九)——基於GMM-HMM的連續語音識別系統

上一專題GMM-HMM聲學模型中講述了其理論知識,這一章利用理論搭建一套GMM-HMM系統,來識別連續0123456789的英文語音。 本系統是單音素,未涉及后面三音子的訓練以及決策樹的內容。 在GMM專題和HMM專題中分別講述了其訓練都是EM算法,那么融合形成GMM-HMM模型后會 ...

Mon Oct 05 00:54:00 CST 2020 0 686
機器學習&數據挖掘筆記_14(GMM-HMM語音識別簡單理解)

  為了對GMM-HMM語音識別上的應用有個宏觀認識,花了些時間讀了下HTK(用htk完成簡單的孤立詞識別)的部分源碼,對該算法總算有了點大概認識,達到了預期我想要的。不得不說,網絡上關於語音識別的通俗易懂教程太少,都是各種公式滿天飛,很少有說具體細節的,當然了,那需要有實戰經驗才行 ...

Fri Aug 23 15:34:00 CST 2013 1 34167
語音合成中聲學模型在可控性上的努力

本文主要介紹3種模型,分別是前向注意力(Forward Attention,FA/FA+TA),逐步單向注意力(Stepwise Monotonic Attention,SMA)和FastSpeech2,前兩者都是要求注意力權重盡量保證單調向前。具體來說,假設某一解碼步上的注意力權重 ...

Mon Feb 01 19:17:00 CST 2021 1 351
【sphinx】中文聲學模型訓練

一 .使用CMUSphinx訓練聲學模型 CMUSphinx工具包中自帶好幾個高質量的聲學模型。美語模型,法語,中文模型。這些模型是經過優化的,為了得到最佳的性能,大多數指令交互系統能直接用這些模型,甚至一些大詞匯量的應用也能直接用他們。 除此之外,CMUSphinx提供了功能 ...

Fri Sep 18 02:59:00 CST 2015 0 4635
聲學模型算法總結 2016 年語音識別的重大進步丨硬創公開課

https://zhuanlan.zhihu.com/p/24979135 雷鋒網按:在過去的一年中,語音識別再次取得非常大的突破。IBM、微軟等多家機構相繼推出了自己的 Deep CNN 模型,提升了語音識別的准確率;Residual/Highway 網絡的提出使我們可以把神經網絡訓練 ...

Mon Mar 13 23:30:00 CST 2017 0 1803
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM