機器學習分類模型評價指標和方法


一、ROC曲線:

1、混淆矩陣:

針對二元分類問題,將實例分為正類或者負類,會出現四種情況:

(1)實例本身為正類,被預測為正類,即真正類(TP);

(2)實例本身為正類,被預測為負類,即假負類(FN);

(3)實例本身為負類,被預測為正類,即假正類(FP);

(4)實例本身為負類,被預測為負類,即真負類(TN);

然后可以構建混淆矩陣,如下表所示:

(1)准確率(又稱查准率)Precision,  P=TP/(TP+FP)

(2)召回率(又稱查全率)Recall,  R=TP/(TP+FN)

(3)F1-Score,F1=2PR/(P+R)

recall 體現了分類模型對正樣本的識別能力,recall 越高,說明模型對正樣本的識別能力越強;

precision 體現了模型對負樣本的區分能力,precision越高,說明模型對負樣本的區分能力越強;

F1-score 是兩者的綜合,F1-score 越高,說明分類模型越穩健。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM