詞錯率(WER)
使識別出來的詞序列和標准的詞序列之間保持一致,需要進行替換,刪除,或者插入某些詞,這些插入,替換,刪除的詞的總個數,除以真實詞序列中詞的個數的百分比,即為WER,其計算公式如下所示:
例1:
REF:真實詞序列
HYP:識別詞序列
I 插入 S 替換 D 刪除
字錯率(CER)
與詞錯率相似,以字符的識別結果為計算單位。
實時因子(RTF)
real time factor :實時因子,一般在實時語音識別過程中的評價延遲標准。RTF定義為模型解碼時間與輸入音頻持續時間的比率。
句錯率(SER)
SER表示為句子中如果有一個詞識別錯誤,那么這個句子被認為識別錯誤,計算公式如下:
RT90
即實時因素(處理時間除以音頻持續時間)為90%,其中較低的值表示處理速度更快和較低的用戶感知延遲
(RT:Response Time,響應時間,執行一個請求從開始到最后收到響應數據所花費的總體時間,即從客戶端發起請求到收到服務器響應結果的時間。)