下載imagenet2012數據集,以及label說明


updated@2018-12-07 15:22:08

官方下載地址:http://www.image-net.org/challenges/LSVRC/2012/nonpub-downloads ,需要“非.com結尾的郵箱注冊的賬號”

也可以從網盤下載,鏈接:https://pan.baidu.com/s/17gQSrqD2j921HEMYVGVZ7Q 密碼:28fj
(注:此網盤分享目錄中沒有test和train的image,因為都比較大,沒有傳)

下面聽我啰嗦一下:

分類和定位任務(task1&&task2, 即classification && localization)

圖片
http://www.image-net.org/challenges/LSVRC/2012/nnoupb/ILSVRC2012_img_train.tar
http://www.image-net.org/challenges/LSVRC/2012/nnoupb/ILSVRC2012_img_val.tar
http://www.image-net.org/challenges/LSVRC/2012/nnoupb/ILSVRC2012_img_test.tar(三個任務的test圖片都在一個壓縮包里)

開發包
http://www.image-net.org/challenges/LSVRC/2012/nnoupb/ILSVRC2012_devkit_t12.tar (含val標簽)

標簽

synset.txt下載地址:

分類任務(classification)的val的標簽在開發包里:D:\data\imagenet\ILSVRC2012_devkit_t12\data\ILSVRC2012_validation_ground_truth.txt,開頭幾行:

490  #表示第1張val的圖片,label為490
361
171
822

這個label有個小問題:和一些開源的caffemodel的輸出對不上,比如MobileNet,對於ILSVRC2012_val_00000001.JPEG的top1預測結果是:

confidence: 0.75
category index: 65
label: 'n01751748 sea snake'

但是從ILSVRC2012_validation_ground_truth.txt看到的label是490。兩種解決思路:

1)使用caffe版本的imagenet2012分類任務label,而不是devkit中的。
基於caffe訓練的,使用了get_ilsvrc_aux.sh文件下載的imagenet的label。這些label和imagnet官方的不一樣。
其實就是從http://dl.caffe.berkeleyvision.org/caffe_ilsvrc12.tar.gz下載的caffe版本imagenet標簽。

2)使用映射表,把基於caffe版本的imagenet分類label,映射為imagenet原版lable,或把imagenet原版label映射為caffe版本。
映射表下載地址:https://github.com/fh295/semanticCNN/blob/master/imagenet_labels/ILSVRC2012_mapping.txt 。至於這個映射表怎么來的,迷一樣。

BBox
http://www.image-net.org/challenges/LSVRC/2012/nnoupb/ILSVRC2012_bbox_train_v2.tar.gz (我只做分類任務,這些框沒有用過)

檢測任務(task3, object detection)

圖片
http://www.image-net.org/challenges/LSVRC/2012/nnoupb/ILSVRC2012_img_train_t3.tar
http://www.image-net.org/challenges/LSVRC/2012/nnoupb/ILSVRC2012_img_test.tar (前面列出過了,三個任務的test圖片都在一個壓縮包里)

開發包
http://www.image-net.org/challenges/LSVRC/2012/nnoupb/ILSVRC2012_devkit_t3.tar.gz

標簽
http://www.image-net.org/challenges/LSVRC/2012/nnoupb/ILSVRC2012_bbox_train_v2.tar

評論區有人提到沒有給annotation的下載地址。原版地址忘記了,不過可以從百度網盤下載:

關於label的說明(僅驗證過validation的label,train理論上也是這樣):
http://www.image-net.org/challenges/LSVRC/2012/nnoupb/ILSVRC2012_devkit_t12.tar.gz

吐槽

caffe標簽到原版標簽的映射:
caffemodel預測出top1的index是idx(比如65),加上1就是66,對應到synsets.txt第66行,也就是n01751748;從ILSVRC2012_mapping.txt找到n01751748,對應的映射id為490,表示原版imagenet label是490(1開始標記)或489(0開始標記)

整這么麻煩,其實直接用caffe版本的標簽好了。。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM