二類分類問題評價指標


1. 准確率

評價分類問題的性能的指標一般是分類准確率,其定義是對於給定的數據,分類正確的樣本數占總樣本數的比例。但是這一指標在Unbalanced的數據上表現很差。比如說我的樣本有990個正樣本,10個負樣本,我直接把所有樣本都預測為正,我的准確率為99%,居然有這么高得准確率,但我的分類方法實際是非常不具有說服力的。

2. 精確率和召回率

對於二分類問題常用的評價指標是精確率和召回率。通常以關注的類為正類,其他類為負類,分類器在數據集上的預測或者正確或者不正確,我們有4中情況,在混淆矩陣中表示如下:

精確率 :P = TP / (TP + FP)

召回率: R = TP / (TP + FN)

F1: 精確率和召回率的調和平均。 即: 2/F1 = 1/P + 1/R

直觀上來解釋精確率和召回率。

精確率表示我現在有了這么的預測為正的樣本,那么這些樣本中有多少是真的為正呢?

召回率表示我現在預測為正的這些值中,占了所有的正的為正的樣本的多大比例呢?

不同的分類問題,對精確率和召回率的要求也不同。

例如:假幣預測,就需要很高的精確率,我需要你給我的預測數據具有很高的准確性。

腫瘤預測就需要很高的召回率。“寧可錯殺三千,不可放過一個”。

3. ROC和AUC   [^1]

TPR = TP / (TP + FN)

FPR = FP / (FP + TN)

我們使用FPR作為橫坐標,TPR作為縱坐標得到ROC曲線如下:

接下來主要考察ROC曲線中的四個點和一條線:

為了方便分析,橫縱坐標再寫於此處:

FPR = FP / (FP + TN)    TPR = TP / (TP + FN)

(0,1): FN = 0, FP = 0, 表示所有樣本都正確分類,這是一個完美的分類器;

(1,0):TN = 0, TP = 0, 表示所有樣本都分類錯誤,這是一個最糟糕的分類器;

(0, 0): FP = 0, TP = 0, 表示所有樣本都分類為負

(1,1): TN = 0, FN = 0, 表示左右樣本都分類為正

經過以上分析,我們可以斷言,ROC曲線越靠近左上角,該分類器的性能越好。

下面考慮上圖虛線與 y = x,該對角線實際上表示一個隨機猜測的分類器的結果。

如何畫ROC曲線呢?我們回想我們的數據時什么樣子的,在二分類問題中,我們最終得到的數據時對每一個樣本,估計其為正的概率值。現在我們根據每個樣本為正的概率大小從大到小進行排序,下圖是一個示例,圖

中共有20個測試樣本,“Class”一欄表示每個測試樣本真正的標簽(p表示正樣本,n表示負樣本),“Score”表示每個測試樣本屬於正樣本的概率。

接下來,我們從高到低,依次將“Score”值作為閾值threshold,當測試樣本屬於正樣本的概率大於或等於這個threshold時,我們認為它為正樣本,否則為負樣本。舉例來說,對於圖中的第4個樣本,其“Score”值為

0.6,那么樣本1,2,3,4都被認為是正樣本,因為它們的“Score”值都大於等於0.6,而其他樣本則都認為是負樣本。每次選取一個不同的threshold,我們就可以得到一組FPR和TPR,即ROC曲線上的一點。這樣一

來,我們一共得到了20組FPR和TPR的值,將它們畫在ROC曲線的結果如下圖:

AUC:ROC曲線下的面積,引入AUC的原因是量化評價指標。

AUC面積越大,分類效果越好。AUC小於1,另一方面,正常的分類器你應該比隨機猜測效果要好吧?所以 0.5 <= AUC <= 1

之前一直不理解一句話:AUC表征了分類器把正樣本排在負樣本前邊的能力。這里的意思其實是指數據按照其為正的概率從大到小排序之后,正樣本排在負樣本前邊的能力。AUC越大,就有越多的正樣本排在負樣本前邊。極端來看,如果ROC的(0, 1)點,所有的正樣本都排在負樣本的前邊。

4. ROC 與 P, R對比

ROC曲線特性:當測試集中的正負樣本的分布變化的時候,ROC曲線能夠保持不變。

(在實際的數據集中經常會出現類不平衡(class imbalance)現象,即負樣本比正樣本多很多(或者相反),而且測試數據中的正負樣本的分布也可能隨着時間變化。)

下圖是ROC曲線和Precision-Recall曲線的對比:

a,c為ROC曲線,b,d為P-R曲線;

a,b 為在原始測試集(balanced)上的結果,c,d為把原始數據集的負樣本增加10倍后的結果。很明顯,ROC曲線基本保持不變,P-R曲線變化較大。

 

另外,為什么取AUC較好?因為一個二分類問題,如果你取P或R的話,那么你的評價結果和你閾值的選取關系很大,但是我這個一個分類器定了,我希望評價指標是和你取得閾值無關的,也就是需要做與閾值無關的處理。所以AUC較P R好。

 

[^1]:關於ROC和AUC的介紹,主要參考:https://www.douban.com/note/284051363/ 一部分直接摘錄

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM