查准率與查全率(precision and recall) 的個人理解


 

  假設要識別照片中的狗的,在一些照片中,包含12只狗的照片和一些貓的照片。算法識別出有8只狗。在確定的8只狗中,5只實際上是狗(真陽性TP),而其余的是貓(假陽性FP)。該程序的精度為5/8,而其召回率為5/12。

 

 

  Predicted    
Actual   狗(+) 貓(-)  
狗(+) 5(TP) FN 12
貓(-) 3(FP) TN  
  8    

      Confusion matrix

 

TP:  T 是指標記正確,  P 是指實際中的類別是P類, 所以

 

TP:正確地標記為正。

 

FP:錯誤地標記為正(即原來是負,標記成正)。

 

FN:錯誤地標記為負(即原來是正,標記成負)。

 

TN:正確地標記為負。

 

查准率 = 精度 = precision 

查全率 = 召回率 = recall

 

  

   {\displaystyle {\text{Recall}}={\frac {tp}{tp+fn}}\,}



 

  當搜索引擎返回30個頁面時,只有20個頁是相關的(實際相關),而沒有返回另外40個相關頁面,其精度為20/30 = 2/3,而召回率為20/60 = 1/3。所以,在這種情況下,精度是“搜索結果有用”,召回率是“結果如何完整”。

  Predicted    
Actual   (+) (-)  
(+) 20(TP) 40(FN) 60
(-) FP TN  
  30    

        Confusion matrix

  

 

    商品推薦系統中,為了盡可能地少打擾用戶,更希望推薦內容確實是用戶感興趣的,就要提高精度(查准率),在分類時,慎重地預測為+,也就是說,預測成正地比例將減小,即中 TP+FP變小,分母變小,分子也變小,但是分母變化的更劇烈,所以精度變大。在公式{\displaystyle {\text{Recall}}={\frac {tp}{tp+fn}}\,}中,TP變小,分子變小,分母(實際的正類)不變,召回率變小。

  在逃犯信息檢索系統中,更希望盡可能地少漏掉逃犯,此時,就要提高召回率(查全率),在分類時,盡量多的預測為+,就需要提高預測正類的比例,TP+FP 變大,TP變大,在公式{\displaystyle {\text{Recall}}={\frac {tp}{tp+fn}}\,}中 TP變大,分母不變,分子變大,所以召回率變大。在公式中,分母變大,分子變大,但是分母變化的更劇烈,所以精度變小。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM