imagenet 種子
迅雷打開
驗證集
http://academictorrents.com/download/5d6d0df7ed81efd49ca99ea4737e0ae5e3a5f2e5.torrent
訓練集
http://academictorrents.com/download/a306397ccf9c2ead27155983c254227c0fd938e2.torrent
數據集處理:
下載后得到2個 .tar 文件,為了防止文件損壞,使用md5校驗
驗證集校驗:
md5sum ILSVRC2012_img_val.tar
應得到:29b22e2961454d5413ddabcf34fc5622
訓練集校驗:
md5sum ILSVRC2012_img_train.tar
應得到:1d675b47d978889d74fa0da5fadfb00e
解壓縮數據集放置到 train/val 文件夾中並整理:
統計圖片數量可用如下命令:
cnt=0; for f in `ls`; do cd $f; cur=`ls|wc -l`; cnt=`expr $cnt + $cur`; cd ..; done; echo $cnt
驗證集
wget https://raw.githubusercontent.com/soumith/imagenetloader.torch/master/valprep.sh
mkdir val && tar -xvf ILSVRC2012_img_val.tar -C val && mv valprep.sh val && cd val && bash valprep.sh
其中用到的 valprep.sh 會將驗證集整理為和訓練集相同的格式,也可以從 這里 下載
驗證集共有 50000 張圖片
訓練集
mkdir train && tar -xvf ILSVRC2012_img_train.tar -C train && for x in `ls train/*tar`; do fn=train/`basename $x .tar`; mkdir $fn; tar -xvf $x -C $fn; rm -f $fn.tar; done
訓練集共有1281167 張圖片