F1分數


分類的常用指標有:

accuracy:准確率

recall:召回率

precison:精確率

f1score:f1分數,是recall和precison的調和均值。

 

准確率什么情況下失效?

在正負樣本不均衡的情況下,accuracy這個指標有很大的缺陷。

如:正樣本990個,負樣本10個。

這樣好像也沒有什么用處哦?

原因是關注正樣本還是負樣本。

默認是關注正樣本,而此時的正樣本太多,就算混入幾個副樣本也無傷大雅。

但大部分情況下是那10個才叫“正樣本”,比如異常檢測里,990個正常,10個異常,我們可能會更關注那10個異常。這10個異常叫做正樣本。

此時就有 10 個正樣本,990個負樣本。

此時的准確率是多少呢?

幾個指標的通俗說明

 

recall:召回率,也叫查全率。其實就是

 

在上面的例子中,原本正樣本990個負樣本10個。預測結果為:1000個正樣本。

怎么計算召回率呢?

 

召回率 = 預測對的所有正例 / 原本的所有正例

 

  • 1000個正例中,預測對的正例是多少呢?990個啊。
  • 原本的所有正例呢? 990個啊。 那么:

 

當然查的越全越好,查的越准也越好。但一般情況下,這兩個值是“此消彼長”的關系。所以就要有Fscore了,Fscore是R、P的調和均值,也是越大越好。一般用F1_score

 

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM