lmageNet 數據集簡介
ImageNet數據集是一個計算機視覺數據集,是由斯坦福大學的李飛飛教授帶領創建。該數據集包合 14,197,122張圖片和21,841個Synset索引。 Synset是WordNet層次結構中的一個節點,它又是 一組同義詞集合。 ImageNet數據集一直是評估圖像分類算法性能的基准。
ImageNet 數據集是為了促進計算機圖像識別技術的發展而設立的一個大型圖像數據集。2016 年ImageNet 數據集中已經超過干萬張圖片,每一張圖片都被手工標定好類別。ImageNet 數據集中的圖片涵蓋了大部分生活中會看到的圖片類別。ImageNet最初是擁有超過100萬張圖像的數據集。如圖下圖所示,它包含了各種各樣的圖像,並且每張圖像都被關聯了標簽(類別名)。每年都會舉辦使用這個巨大數據集的ILSVRC圖像識別大賽。
ImageNet是一個按照WordNet層次結構(目前只有名詞)組織的圖像數據庫,其中層次結構的每個節點都由成百上千個圖像來描述。目前,我們平均每個節點有500多個圖像。
1、ImageNet數據集的意義
- ImageNet擁有用於分類、定位和檢測任務評估的數據。
- 與分類數據類似,定位任務有1000個類別。准確率是根據最高五項檢測結果計算出來的。
- 所有圖像中至少有一個邊框。對200個目標的檢測問題有470000個圖像,平均每個圖像有1.1個目標。
2、ImageNet的數據結構——層次結構及其1000個類別
3、ImageNet數據集與ILSVRC競賽的關系、
ILSVRC使用ImageNet的一個子集,總共有大約120萬個訓練圖像,50,000個驗證圖像,以及150,000個測試圖像;1000類別標記。
Large Scale Visual Recognition Challenge 即ILSVRC(2012~2017)比賽,是基於該數據集的1000個類別的比賽。訓練集120萬張圖片。 從2010年起, 每年ImageNet 的項目組織都會舉辦一場基於ImageNet 的大規模視覺識別競賽( lmageNet Large Scale VisualRecognition Challenge , ILSVRC ) 。在ILSVRC 競賽中誕生了許多成功的圖像識別方法,其中很多是深度學習方法, 它們在賽后又會得到進一步發展與應用。
可以說, ImageNet 數據集和ILSVRC 競賽大大促進了計算機視覺技術, 乃至深度學習的發展, 在深度學習的浪潮中占有舉足輕重的地位。
4、與CIFAR-10數據集比較
相比CIFAR-10 , ImageNet 數據集圖片數量更多, 分辨率更高,含有的類別更多(高上干個圖像類別),圖片中含高更多的無關噪聲和變化,因此識別難度比CIFAR-10 高得多。
5、數據集下載
具體下載方式參見知乎:ImageNet數據集下載與處理 - 知乎 (zhihu.com)