F1 score,micro F1score,macro F1score 的定義


F1 score,micro F1score,macro F1score 的定義

本篇博客可能會繼續更新

最近在文獻中經常看到precesion,recall,常常忘記了他們的定義,在加上今天又看到評價多標簽分類任務性能的度量方法micro F1score和macro F2score。決定再把F1 score一並加進來把定義寫清楚,忘記了再來看看。

F1score

F1score(以下簡稱F1)是用來評價二元分類器的度量,它的計算方法如下:

 


F1是用來衡量二維分類的,那形容多元分類器的性能用什么呢?micro F1score,和macro F2score則是用來衡量多元分類器的性能。

 

假設對於一個多分類問題,有三個類,分別記為1、2、3,

TPi是指分類i的True Positive;
FPi是指分類i的False Positive;
TNi是指分類i的True Negative;
FNi是指分類i的False Negative。

我們分別計算每個類的精度(precision)


macro 精度 就是所有分類的精度平均值


同樣,每個類的recall計算為


macro 召回就是所有分類的召回平均值


套用F1score的計算方法,macro F1score就是

micro F1score

假設對於一個多分類問題,有三個類,分別記為1、2、3,

TPi是指分類i的True Positive;
FPi是指分類i的False Positive;
TNi是指分類i的True Negative;
FNi是指分類i的False Negative。
接下來,我們來算micro precision


相應的micro recall則是


則micro F1score為

總結

如果各個類的分布不均衡的話,使用micro F1score比macro F1score 比較好,顯然macro F1score沒有考慮各個類的數量大小

參考
該網址一位答主的回答,我搬運過來


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM