F1-Score相關概念
- F1分數(F1 Score),是統計學中用來衡量二分類(或多任務二分類)模型精確度的一種指標。它同時兼顧了分類模型的准確率和召回率。
- F1分數可以看作是模型准確率和召回率的一種加權平均,它的最大值是1,最小值是0,值越大意味着模型越好。
- 假如有100個樣本,其中1個正樣本,99個負樣本,如果模型的預測只輸出0,那么正確率是99%,這時候用正確率來衡量模型的好壞顯然是不對的。
|
label-1 |
label-0 |
pre-1 |
True Positive(TP)真陽性 |
False Positive(FP)假陽性 |
pre-0 |
False Negative(FN)假陰性 |
True Negative(TN)真陰性 |
F-Beta
- 查准率(precision),指的是預測值為1且真實值也為1的樣本在預測值為1的所有樣本中所占的比例。以西瓜問題為例,算法挑出來的西瓜中有多少比例是好西瓜。
precision = \frac{TP}{TP+FP}

- 召回率(recall),也叫查全率,指的是預測值為1且真實值也為1的樣本在真實值為1的所有樣本中所占的比例。所有的好西瓜中有多少比例被算法挑了出來。
recall = \frac{TP}{TP+FN}

- F1分數(F1-Score),又稱為平衡F分數(BalancedScore),它被定義為精確率和召回率的調和平均數。
F_1 = 2 \cdot \frac{precisiont \cdot recall}{precision + recall}

F_\beta = (1 + \beta^2) \cdot \frac{precisiont \cdot recall}{(\beta^2 \cdot precision) + recall}

- 除了F1分數之外,F0.5分數和F2分數,在統計學中也得到了大量應用,其中,F2分數中,召回率的權重高於精確率,而F0.5分數中,精確率的權重高於召回率。
Macro-F1和Micro-F1
- Macro-F1和Micro-F1是相對於多標簽分類而言的。
- Micro-F1,計算出所有類別總的Precision和Recall,然后計算F1。
- Macro-F1,計算出每一個類的Precison和Recall后計算F1,最后將F1平均。