總結自《機器學習》周志華 2.3
目錄
最常用的是查准率P(precision),查全率R(recall),F1
一、對於二分類問題
二、對於多分類問題
1.macro
2.micro
最常用的是查准率P(precision),查全率R(recall),F1
一、對於二分類問題
混淆矩陣(confusion matrix):
預測結果 | ||
真實情況 | 正例 | 反例 |
正例 | TP,true positive,真正 | FN,false negative 假反 |
反例 | FP ,false positive,假正 | TN,true negative 真反 |
查准率=真正 / (真正+假正) = predicted and true positive/ predicted positive
查全率= 真正 /(真正+假反) = predicted and true positive/ true positive
P , R是一對矛盾的度量,一般一個的值高了,另一個的值就會降低,
P-R圖:
若學習器A的 P-R曲線 將學習器B的 P-R曲線 完全包住,則學習器A 在該問題上 優於 B
若A B的P-R曲線有交叉, 則比較P-R曲線下面積的大小,越大越好
平衡點 break even point BEP,是P==R 時的取值
F值度量:
,n為樣例總數
β>1,R有更大影響,β<1,P有更大影響
二、對於多分類問題
多分類問題,每兩兩類別組合,構成n個二分類問題,每個二分類問題對應一個混淆矩陣
1.macro
先在各個混淆矩陣上分別計算P,R, 再求平均得到 宏查准率macro-P, 宏查全率macro-R,
基於宏查准率macro-P, 宏查全率macro-R,計算 宏F1 macro-F1
2.micro
將各個混淆矩陣的對應元素進行平均,得到TP,FP,TN,FN的平均值: