updated@2018-12-07 15:22:08
官方下載地址:http://www.image-net.org/challenges/LSVRC/2012/nonpub-downloads ,需要“非.com結尾的郵箱注冊的賬號”
也可以從網盤下載,鏈接:https://pan.baidu.com/s/17gQSrqD2j921HEMYVGVZ7Q 密碼:28fj
(注:此網盤分享目錄中沒有test和train的image,因為都比較大,沒有傳)
下面聽我啰嗦一下:
分類和定位任務(task1&&task2, 即classification && localization)
圖片
http://www.image-net.org/challenges/LSVRC/2012/nnoupb/ILSVRC2012_img_train.tar
http://www.image-net.org/challenges/LSVRC/2012/nnoupb/ILSVRC2012_img_val.tar
http://www.image-net.org/challenges/LSVRC/2012/nnoupb/ILSVRC2012_img_test.tar(三個任務的test圖片都在一個壓縮包里)
開發包
http://www.image-net.org/challenges/LSVRC/2012/nnoupb/ILSVRC2012_devkit_t12.tar (含val標簽)
標簽
synset.txt下載地址:
分類任務(classification)的val的標簽在開發包里:D:\data\imagenet\ILSVRC2012_devkit_t12\data\ILSVRC2012_validation_ground_truth.txt
,開頭幾行:
490 #表示第1張val的圖片,label為490
361
171
822
這個label有個小問題:和一些開源的caffemodel的輸出對不上,比如MobileNet,對於ILSVRC2012_val_00000001.JPEG的top1預測結果是:
confidence: 0.75
category index: 65
label: 'n01751748 sea snake'
但是從ILSVRC2012_validation_ground_truth.txt看到的label是490。兩種解決思路:
1)使用caffe版本的imagenet2012分類任務label,而不是devkit中的。
基於caffe訓練的,使用了get_ilsvrc_aux.sh文件下載的imagenet的label。這些label和imagnet官方的不一樣。
其實就是從http://dl.caffe.berkeleyvision.org/caffe_ilsvrc12.tar.gz下載的caffe版本imagenet標簽。
2)使用映射表,把基於caffe版本的imagenet分類label,映射為imagenet原版lable,或把imagenet原版label映射為caffe版本。
映射表下載地址:https://github.com/fh295/semanticCNN/blob/master/imagenet_labels/ILSVRC2012_mapping.txt 。至於這個映射表怎么來的,迷一樣。
BBox
http://www.image-net.org/challenges/LSVRC/2012/nnoupb/ILSVRC2012_bbox_train_v2.tar.gz (我只做分類任務,這些框沒有用過)
檢測任務(task3, object detection)
圖片
http://www.image-net.org/challenges/LSVRC/2012/nnoupb/ILSVRC2012_img_train_t3.tar
http://www.image-net.org/challenges/LSVRC/2012/nnoupb/ILSVRC2012_img_test.tar (前面列出過了,三個任務的test圖片都在一個壓縮包里)
開發包
http://www.image-net.org/challenges/LSVRC/2012/nnoupb/ILSVRC2012_devkit_t3.tar.gz
標簽
http://www.image-net.org/challenges/LSVRC/2012/nnoupb/ILSVRC2012_bbox_train_v2.tar
評論區有人提到沒有給annotation的下載地址。原版地址忘記了,不過可以從百度網盤下載:
關於label的說明(僅驗證過validation的label,train理論上也是這樣):
http://www.image-net.org/challenges/LSVRC/2012/nnoupb/ILSVRC2012_devkit_t12.tar.gz
吐槽
caffe標簽到原版標簽的映射:
caffemodel預測出top1的index是idx(比如65),加上1就是66,對應到synsets.txt第66行,也就是n01751748;從ILSVRC2012_mapping.txt找到n01751748,對應的映射id為490,表示原版imagenet label是490(1開始標記)或489(0開始標記)
整這么麻煩,其實直接用caffe版本的標簽好了。。