混淆矩陣:
混淆矩陣的正例一般是我們需要關注的,常用1表示,反例是我們不關注的,常用0表示。例如:一個需要識別借貸需求的人的分類任務中,正例表示有借貸需求的人,反例表示沒有借貸需求的人。下面定義一些基於混淆矩陣的度量分類任務的方法:
查准率(Precision):
基於這個借貸需求識別任務說明:所有識別出來的正例中真實正例的占比,越高越好。
召回率(Rcall):
基於這個借貸需求識別任務說明:所識別出來的正例在在實際正例中的占比,越高越好。
當然TP越高,二者都高。但是現實中這兩個一般一個高,另一個就低。在借貸需求識別任務中識別出的正例會交給電話銷售,如果電話銷售成本高,我們當然希望識別出的正例中真實正例越高越好,即優先保證查全率高;如果電話銷售的成本低,那么有限保證召回率高。
F1度量: