語音識別概述


后驗概率最大,即為判別結果

HTK Hvite解碼器   Sphinx解碼器 TODE解碼器,生硬,修改繁瑣。

WFST 擴充,簡單高效。

有限狀態機模型被用於大詞匯量連續中文語音識別系統中。

其操作思路是將傳統語音識別系統中的數學模型,分別轉換成有限狀態機模型,再將轉換后的模型進行有效地整合及優化,得到搜索空間。

 

有限狀態自動機(Finite-state Automata,FSA)

 用點表示狀態,帶箭頭的方向線段表示轉移,轉移上的字符為輸入字元;用加粗圓圈表示初始狀態,雙線圓圈表示終止狀態

節點 (Node) 即狀態 (state

 由字元所構成的有限長度詞序列成為字串

將兩個字串連接在一起的操作稱為連接運算例:𝑎 · 𝑏 = 𝑐 表示在字串 后面連接上字串 形成字串 c

 一個字串不包含任何字元,則稱為空字串

 

加權有限狀態轉換器(WFST)是有限狀態機的一種特殊形式

合並前

 

 

 合並后

 

 

 

            隱馬爾可夫模型

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

         

 

 

 

 

 

 參考文獻:基於WFST的中文語音識別解碼器的研究


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM