目標檢測之常用數據集
我們在利用模型檢測實際應用問題的時候,通常需要使用自己標注和收集數據集來進行訓練。
但對於不同算法性能的比較,我們常常需要一些基本的數據集來進行橫向對比。
下列是一些常用的目標檢測數據集:
- PASCAL VOC
- ImageNet
- COCO
1.PASCAL VOC challange
PASCAL VOC挑戰在2005年至2012年間展開。
PASCAL VOC 2007:9963張圖像,24640個標注。
PASCAL VOC 2012: 11530張圖像,27450個標注。
該數據集中有20個分類,同時包含11530張用於訓練和驗證的圖像,其中感興趣區域有27450個標定目標,每個圖像平均有2.4個目標。
以下是數據集中的20個分類:
-
Person(人):person(人)
-
Animal(動物):bird(鳥)、cat(貓)、cow(牛)、dog(狗)、horse(馬)、sheep(羊)
-
Vehicle(車輛):aeroplane(飛機)、bicycle(自行車)、boat(船)、bus(巴士)、car(汽車)、motorbike(摩托車)、train(火車)
-
indoor(室內):bottle(瓶)、chair(椅子)、dining table(餐桌)、potted plant(盆栽植物)、sofa(沙發)、tv(電視)/monitor(監視器)
鏈接:http://host.robots.ox.ac.uk/pascal/VOC/voc2012/
2 ImageNet數據集
ILSVRC 2010-2017為斯坦福大學的李飛飛教授主導並組建的數據集。
- ImageNet擁有用於分類、定位和檢測任務評估的數據
- 與分類數據類似,定位任務有1000個類別。准確率是根據Top 5檢測結果計算出來的。
- 對200個目標的檢測問題有470000個圖像,平均每個圖像有1.1個目標。
3 MS COCO數據集
-
MS COCO的全稱是Microsoft Common Objects in Context,起源於微軟於2014年出資標注的Microsoft COCO數據集,與ImageNet競賽一樣,被視為計算機視覺領域最受關注和最權威的比賽之一。
-
在ImageNet競賽停辦后,COCO競賽就成為是當前目標識別、檢測等領域的一個最權威、最重要的標桿,也是目標該領域在國際上唯一能匯集Google、微軟、Facebook以及國內外眾多頂尖院校和優秀創新企業公共參與的大賽。
-
COCO(Common Objects in Context)數據集包含20萬個圖像:11.5萬多訓練集驗證集圖像,2萬多張測試集圖像。
-
80個類別中有超過50萬個目標標注。他是最廣泛公開的目標檢測數據集。
-
平均每個圖像的目標數為7.2個。