VOC2007檢測任務的評估標准


VOC2007數據集使用mAP值作為檢測算法檢測結果的性能評估得分。mAP意思是mean Average Precision,Precision是指精度,Average Precision是指11個等分候選點上的精度,mean Average Precision是指所有類別的AP的平均。

嗯,聽起來挺繞的。詳細說來:

計算AP后會繪制PR曲線:縱坐標是P表示Precision精度,橫坐標表示Recall表示召回率。
TP=True Positive, FP=False Positive, TN=True Negative, FN=False Negative
Precision=TP/(TP+FP), Recall=TP/(TP+FN)

而我們實際的檢測結果往往是這樣的:

im_id, x1, y1, x2, y2, score

這個score是單個檢測結果的“信心”,或者叫“可信度”,用來給檢測結果之間排序。查看VOCdevkit的代碼不難發現,評估過程中會根據score做bbdt的降序排序,然后逐一處理。

其實一般的檢測結果bbdt都是經過nms的。那么所有bbdt一起排序其實沒什么必要。

對於所有bbdt,考慮im_id相同的,也就是同一張測試圖像上的檢測結果,將它們按照score降序排序,然后逐一去匹配ground truth,如果IoU大於0.5則認為匹配成功,則這個ground truth的bbox要做一個標記,后續不能再匹配它。這種可能是存在的:因為可能這個bbgt很大,而有兩個bbdt幾乎沒有交叉地、分別匹配上了這個bbgt的兩個部分。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM