准確率（Precision）、召回率（Recall）以及綜合評價指標（F1-Measure ）

本文轉載自查看原文 2012-09-18 09:19 44348 search/ precision/ recall/ information retrieval/ Information Retrieval

在信息檢索和自然語言處理中經常會使用這些參數，下面簡單介紹如下：

准確率與召回率（Precision & Recall）

我們先看下面這張圖來加深對概念的理解，然后再具體分析。其中，用P代表Precision，R代表Recall

一般來說，Precision 就是檢索出來的條目中（比如：文檔、網頁等）有多少是准確的，Recall就是所有准確的條目有多少被檢索出來了。

下面這張表介紹了True Positive，False Negative等常見的概念，P和R也往往和它們聯系起來。

那么，

\[ P=\frac{tp} {tp+fp} \hfill (1) \]

\[ R=\frac{tp} {tp+fn} \hfill (2) \]

我們當然希望檢索的結果P越高越好，R也越高越好，但事實上這兩者在某些情況下是矛盾的。比如極端情況下，我們只搜出了一個結果，且是准確的，那么P就是100%，但是R就很低；而如果我們把所有結果都返回，那么必然R是100%，但是P很低。

因此在不同的場合中需要自己判斷希望P比較高還是R比較高。如果是做實驗研究，可以繪制Precision-Recall曲線來幫助分析。

F1-Measure

前面已經講了，P和R指標有的時候是矛盾的，那么有沒有辦法綜合考慮他們呢？我想方法肯定是有很多的，最常見的方法應該就是F-Measure了，有些地方也叫做F-Score，其實都是一樣的。

F-Measure是Precision和Recall加權調和平均：

\[ F = \frac{(a^2+1)P*R} {a^2(P+R)} \hfill (3) \]

當參數a=1時，就是最常見的F1了：

\[ F1 = \frac{2PR} {P+R} \hfill (4) \]

很容易理解，F1綜合了P和R的結果，當F1較高時則比較說明實驗方法比較理想。

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 准確率（accuracy），精確率（Precision），召回率（Recall）和綜合評價指標（F1-Measure ）評估指標：准確率(Precision)、召回率(Recall)以及F值(F-Measure) 評估指標：准確率(Precision)、召回率(Recall)以及F值(F-Measure) 准確率(Accuracy)、精確率(Precision)和召回率(Recall)的區別二分類算法的評價指標：准確率、精准率、召回率、混淆矩陣、AUC 准確率、精確率、召回率、F1 F1值，准確率，召回率 Recall（召回率）and Precision（精確率）精確率，准確率和召回率分類問題的幾個評價指標（Precision、Recall、F1-Score、Micro-F1、Macro-F1