語音識別概述 - 碼上歡樂

相關內容簡體繁體

語音識別概述

本文轉載自查看原文 2017-09-07 15:40 2021 從零開始學kaldi

后驗概率最大，即為判別結果

HTK Hvite解碼器 Sphinx解碼器 TODE解碼器，生硬，修改繁瑣。

WFST 擴充，簡單高效。

有限狀態機模型被用於大詞匯量連續中文語音識別系統中。

其操作思路是將傳統語音識別系統中的數學模型，分別轉換成有限狀態機模型，再將轉換后的模型進行有效地整合及優化，得到搜索空間。

有限狀態自動機（Finite-state Automata，FSA）

用點表示狀態，帶箭頭的方向線段表示轉移，轉移上的字符為輸入字元；用加粗圓圈表示初始狀態，雙線圓圈表示終止狀態

節點（Node）即狀態（state）

由字元所構成的有限長度詞序列成為字串

將兩個字串連接在一起的操作稱為連接運算例：𝑎 · 𝑏 = 𝑐 表示在字串 a 后面連接上字串 b 形成字串 c

一個字串不包含任何字元，則稱為空字串

加權有限狀態轉換器（WFST）是有限狀態機的一種特殊形式

合並前

合並后

　　　　　　　　　　　　隱馬爾可夫模型

　　　　　　　　

參考文獻：基於WFST的中文語音識別解碼器的研究

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 JavaScript的語音識別語音識別語音識別: DeepSpeech2 樹莓派的語音識別（四）語音識別測試案例 kaldi與中文語音識別語音識別技術簡介 AI大語音（一）——語音識別基礎 CNN結構和語音識別應用語音識別算法閱讀之DFSMN

粵ICP備18138465號 © 2018-2026 CODEPRJ.COM