查准與召回(Precision & Recall)


Precision & Recall

先看下面這張圖來理解了,后面再具體分析。下面用P代表Precision,R代表Recall

通俗的講,Precision 就是檢索出來的條目中(比如網頁)有多少是准確的,Recall就是所有准確的條目有多少被檢索出來了。

 

下面這張圖介紹True Positive,False Negative等常見的概念,P和R也往往和它們聯系起來。

 

我們當然希望檢索的結果P越高越好,R也越高越好,但事實上這兩者在某些情況下是矛盾的。比如極端情況下,我們只搜出了一個結果,且是准確的,那么P就是100%,但是R就很低;而如果我們把所有結果都返回,那么必然R是100%,但是P很低。

因此在不同的場合中需要自己判斷希望P比較高還是R比較高。如果是做實驗研究,可以繪制Precision-Recall曲線來幫助分析(我應該會在以后介紹)。

F Measure

前面已經講了,P和R指標有的時候是矛盾的,那么有沒有辦法綜合考慮他們呢?我想方法肯定是有很多的,最常見的方法應該就是F Measure了,有些地方也叫做F Score,都是一樣的。

F Measure 是Precision和Recall加權調和平均:

  

F1-Measure

  當參數β=1時,就是最常見的F1-Measure了:

  F1 = 2P*R / (P+R)


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM