分類的常用指標有:
accuracy:准確率
recall:召回率
precison:精確率
f1score:f1分數,是recall和precison的調和均值。
准確率什么情況下失效?
在正負樣本不均衡的情況下,accuracy這個指標有很大的缺陷。
如:正樣本990個,負樣本10個。
這樣好像也沒有什么用處哦?
原因是關注正樣本還是負樣本。
默認是關注正樣本,而此時的正樣本太多,就算混入幾個副樣本也無傷大雅。
但大部分情況下是那10個才叫“正樣本”,比如異常檢測里,990個正常,10個異常,我們可能會更關注那10個異常。這10個異常叫做正樣本。
此時就有 10 個正樣本,990個負樣本。
此時的准確率是多少呢?
幾個指標的通俗說明
recall:召回率,也叫查全率。其實就是
在上面的例子中,原本正樣本990個負樣本10個。預測結果為:1000個正樣本。
怎么計算召回率呢?
召回率 = 預測對的所有正例 / 原本的所有正例
- 1000個正例中,預測對的正例是多少呢?990個啊。
- 原本的所有正例呢? 990個啊。 那么:
當然查的越全越好,查的越准也越好。但一般情況下,這兩個值是“此消彼長”的關系。所以就要有Fscore了,Fscore是R、P的調和均值,也是越大越好。一般用F1_score
