針對二分類的結果,對模型進行評估,通常有以下幾種方法:
Precision、Recall、F-score(F1-measure)
TPR、FPR、TNR、FNR、AUC
Accuracy
真實結果 | |||
1 | 0 | ||
預測結果 | 1 | TP(真陽性) | FP(假陽性) |
0 | FN(假陰性) | TN(真陰性) |
TP(True Positive):預測結果為正類,實際上就是正類
FP(False Positive):預測結果為正類,實際上是反類
FN(False negative):預測結果為反類,實際上是正類
TN(True negative):預測結果為反類,實際上就是反類
1. Precision, Recall, F-score(F-measure)
Precision(准確率)可以理解為預測結果為正類中有多少真實結果是正類的:
Recall(召回率)可以理解為真實結果為正類中有多少被預測成正類:
F-score(F值)又稱作F1-measure,是綜合考慮Precision和Recall的指標:
2. TPR, FPR, TNR, FNR, AUC
TPR(True Positive Rate)可以理解為所有正類中,有多少被預測成正類(正類預測正確),即召回率:
FPR(False Positive Rate)可以理解為所有反類中,有多少被預測成正類(正類預測錯誤):
TNR(True Negative Rate)可以理解為所有反類中,有多少被預測成反類(反類預測正確):
FNR(False Negative Rate)可以理解為所有正類中,有多少被預測成反類(反類預測錯誤):
以FPR(False Positive Rate)為橫坐標,TPR(True Positive Rate)為縱坐標,稱作ROC曲線:
ROC曲線又稱作“受試者工作特性曲線”,很明顯,越靠近左上角的點,效果越好。
AUC(Area Under Curve)定義為ROC曲線下的面積,很明顯,這個值越大越好。
3. Accuracy
Accuracy(精確率)可以理解為所有實驗中,分類正確的個數: