mAP是指平均准確率,是機器學習中模型好壞的一種評價指標。在介紹mAP前應該首先了解幾個概念:
1、P (percision) 准確率,在周志華的《機器學習》中,稱為“查准率”。在信息檢索中,准確率是指我檢索出的信息有多少比例是用戶感興趣的。
P = 系統檢索到的相關文件 / 系統檢索到的文件總數
2、R (recall) 召回率,又稱為“查全率”,指用戶感興趣的信息有多少被檢測出來了
R = 系統檢測到的相關文件 / 數據庫中相關文件總數
舉個例子來說,某數據庫中有1000個文件,我要搜索跟機器學習相關的文件,而數據庫中機器學習相關文件有200個。搜索后,系統檢索出100個文件,80個跟機器學習相關,那么:
P(准確率) = 80 / 100 = 80%
R(召回率)= 80 / 200 = 40%
在改變檢索算法后,再進行一次檢索,結果檢索出180個文件,機器學習相關文件有120個,那么:
P(准確率)= 120 / 180 = 66.7%
R(召回率)= 120 / 200 = 60%
這兩個算法到底哪個算法好呢,很難單一的用准確率或召回率來評判。
准確率和召回率一般有如下特點:准確率高,召回率就低。召回率高,准確率就低。這個也比較容易理解,比如要獲得較高的召回率,勢必要搜索出大量文件,還是上面那個例子,我搜索出500個文件,其中200個跟機器學習相關,那么召回率為100%,但是准確率只有40%。當然,如果算法能做到准確率和召回率都高,那是最好。
那么如何結合准確率和召回率對模型進行評判呢,可以使用F度量
3、F度量(F-measure)
F度量涵蓋了准確率和召回率這兩個指標。其計算公式如下:
F = 2 * P * R / (P + R)
結合以上兩個例子,第一個例子的F度量為0.53,第二個例子的F度量為0.63
接下來進入主題,mAP是什么呢?
前面介紹了准確率和召回率單獨來評價模型不科學,結合這兩個指標的話可以用F度量,其實還有一種方法,即Average Precision(平均精度AP)——以召回率和准確率為行縱坐標,得到二維曲線,即PR曲線。將PR曲線下的面積當作衡量尺度,得到AP值。
mAP即平均AP值,是對多個驗證集求平均AP值,其中QR指驗證集個數

reference:
