對TPR(真正例率) 與 FPR(反正例率)的理解


 

將測試樣本進行排序,“最可能”是正例的排在最前面,“最不可能”是正例的排在最后面。

分類過程就相當於在這個排序中以某個“截斷點”(見圖中閾值)將樣本分為兩部分,前一部分判作正例,后一部分判作反例。

我們根據學習器的預測結果對樣例進行排序,按此順序把逐個樣本作為正例進行預測,每次計算出FPR, TPR,分別為橫縱坐標作圖,可得“ROC曲線”。

TPR 與 FPR

P表示“正”的,為預測為“好的”,即要從總體中挑出來的。

 

真正例率 TPR = TP / (TP + FN)

表示,預測為正例且真實情況為正例的,占所有真實情況中正例的比率。

 

假正例率 FPR = FP / (TN + FP)

表示的,預測為正例但真實情況為反例的,占所有真實情況中反例的比率。

 

TPR越大,則表示挑出的越有可能(是正確的);FPR越大,則表示越不可能(在挑選過程中,再挑新的出來,即再挑認為是正確的出來,越有可能挑的是錯誤的)。

 

TPR 與 FPR 呈反相關,隨着采樣的繼續(見上文:“按此順序把逐個樣本作為正例進行預測,每次計算出FPR, TPR”),越不可能是正例的被采樣出來,TPR降低,FPR升高。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM