語音識別性能評估方法


詞錯率(WER)

使識別出來的詞序列和標准的詞序列之間保持一致,需要進行替換,刪除,或者插入某些詞,這些插入,替換,刪除的詞的總個數,除以真實詞序列中詞的個數的百分比,即為WER,其計算公式如下所示:

 

 

 

例1:

REF:真實詞序列

HYP:識別詞序列

I 插入  S 替換  D 刪除

 

 

 

 

 

字錯率(CER)

與詞錯率相似,以字符的識別結果為計算單位。

 

實時因子(RTF)

real time factor  :實時因子,一般在實時語音識別過程中的評價延遲標准。RTF定義為模型解碼時間與輸入音頻持續時間的比率。

 

 

句錯率(SER)

SER表示為句子中如果有一個詞識別錯誤,那么這個句子被認為識別錯誤,計算公式如下:

 

RT90

即實時因素(處理時間除以音頻持續時間)為90%,其中較低的值表示處理速度更快和較低的用戶感知延遲

(RT:Response Time,響應時間,執行一個請求從開始到最后收到響應數據所花費的總體時間,即從客戶端發起請求到收到服務器響應結果的時間。)

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM