1. 四種情況
Precision精確率, Recall召回率,是二分類問題常用的評價指標。混淆矩陣如下:
T和F代表True和False,是形容詞,代表預測是否正確。
P和N代表Positive和Negative,是預測結果。
預測結果為陽性 Positive | 預測結果為假陽性 Negative | |
---|---|---|
預測結果正確 True | TP | TN |
預測結果錯誤 False | FP | FN |
通常關注的類為正類,其他類為負類。(以貓狗二分類為例,現在關注狗的precision和recall)
TP | 正類預測為正類(預測出狗的圖片實際標注也是狗) |
---|---|
FN | 正類預測為負類(預測出貓的圖片實際標注是狗) |
FP | 負類預測為正類(預測出狗的圖片實際標注是貓) |
TN | 負類預測為負類(預測出貓的圖片實際標注是貓) |
T, F 代表的是圖片對應的標簽,說明是否正確。
P, N 代表的模型預測出來的結果是對的還是錯的。
2. Precision
精確率計算公式:
理解:
TP+FP: 也就是全體Positive, 也就是預測的圖片中是正類的圖片的數目
TP: 也就是正類也被預測為正類的圖片的個數
總之:預測正確的圖片個數占總的正類預測個數的比例(從預測結果角度看,有多少預測是准確的)
3. Recall
召回率計算公式:
理解:
TP+FN: 也就是全體完全滿足圖片標注的圖片的個數
TP:正類被預測為正類的圖片個數
總之:確定了正類被預測為正類圖片占所有標注圖片的個數(從標注角度看,有多少被召回)
4. 二分類舉例
還是以貓狗二分類為例,測試集一共有20張狗, 20張貓的圖片的標注圖片(狗為正例),模型預測出其中有16張圖片是狗,其中14張圖片標注確實為狗,剩下兩張圖片標注為貓。
對於貓來說,剩下的24張圖片是貓,其中有6張是狗,18張是貓。
Positive | Negative | All | |
---|---|---|---|
True | TP: 14 | TN: 18 | 32 |
False | FP: 2 | FN: 6 | 8 |
All | 16 | 24 | 40 |
所以可以進行計算了
5. 多分類舉例
該例引用自:https://www.itcodemonkey.com/article/9521.html
Class1 | Actual_Class1 | Actual_Class2 | Actual_Class3 |
---|---|---|---|
Predicted_Class1 | 30 | 20 | 10 |
Predicted_Class2 | 50 | 60 | 10 |
Predicted_Class3 | 20 | 20 | 80 |
比如我們對class2進行計算:
class2-TP:標簽為class2, 預測為class2 = 60
class2-FN: 標簽為class2, 預測不是class2 = 20+20 = 40
class2-FP: 標簽不為class2, 預測為class2 = 50 + 10 = 60
class2-TN: 標簽不為class2, 預測也不是class2 = 30+10+20+80 = 140
6. 其他指標
F1 值是precision和recall調和平均值: