基於Pre-Train的CNN模型的圖像分類實驗
MatConvNet工具包提供了好幾個在imageNet數據庫上訓練好的CNN模型,可以利用這個訓練好的模型提取圖像的特征。本文就利用其中的 “imagenet-caffe-ref”的模型,提取圖像特征(softmax前一層的輸出,4096維),在幾個常用的圖像分類的數據庫中進行了相應的分類實驗。這實驗的過程中,有對圖片進行左右翻轉用於增加訓練數據。下面結果的表格中:Original原始結果,Flip增加翻轉后的結果。
需要用到的toolbox及模型:
MatConvNet:
http://www.vlfeat.org/matconvnet/
imagenet-caffe-ref:
http://www.vlfeat.org/matconvnet/pretrained/
liblinear: 用於訓練SVM, 實驗中采用linear SVM 以及 c=1
數據庫及相應的實驗結果:
1.
Caltech-101以及Caltech-256
隨機的重復進行10次實驗,取分類的結果的平均值,Training Images是每一個類別使用的訓練圖片數目。
Caltech-101
| Training Images | 5 | 10 | 15 | 20 | 25 | 30 |
| Original | 76.73 ± 0.79 | 82.06 ± 0.36 | 84.10 ± 0.69 | 85.32 ± 0.50 | 86.26 ± 0.44 | 86.96 ± 0.89 |
| Flip | 76.60 ± 0.49 | 82.09 ± 0.45 | 83.91 ± 0.49 | 85.46 ± 0.38 | 86.11 ± 0.34 | 86.98 ± 0.93 |
Caltech-256
| Training Images | 15 | 30 | 45 | 60 |
| Original | 63.76 ± 0.41 | 67.81 ± 0.56 | 69.71 ± 0.48 | 70.84 ± 0.69 |
| Flip | 63.72 ± 0.51 | 67.74 ± 0.54 | 69.65 ± 0.76 | 70.75 ± 0.59 |
2.
Oxford flowers-102
flowers-102是一個用於花卉精細分類的數據庫,數據庫提供了Train,Validation,Test的集合。在實驗過程中,直接使用(Train+Validation)進行訓練,Test進行測試。
| Original | 84.50 |
| Flip | 85.14 |
3.
Scene-15
Scene-15是一個包含15類場景的數據,實驗采用的每一場景取100張圖片做訓練,其余的做測試。重復進行10次實驗
| Original | 86.87 ± 0.75 |
| Flip | 87.00 ± 0.41 |
4.
UC Merced Land Use Dataset
UC Merced Land Use Dataset是一個包含21類場景遙感衛星圖像分類數據庫(每個類別100張圖片),實驗采用的80訓練,20測試,重復10次。
| Original | 94.90 ± 0.95 |
| Flip | 95.14 ± 1.05 |
5. Flickr Material
Flickr Materia是一個關於材料的數據庫,包含10種不同的材料(每種100張圖片),實驗采用50張做訓練,剩下的50張做測試,重復10次實驗。數據庫還提供每一張圖片的Mask,本實驗沒有考慮Mask
| Original | 64.04 ± 2.20 |
| Flip | 62.96 ± 1.54 |
6. UIUC Sports
UIUC Sports是一個包含8中運動類別的數據集,實驗過程中,每一個類別取100張圖片做訓練,其余的做測試。重復進行10次。
| Original | 94.88 ± 1.02 |
| Flip | 95.34 ± 0.83 |
7. MIT Scene
MIT Scene包含有67個室內場景,實驗過程中,每一個類別取80張圖片做訓練,其余的做測試。重復進行10次。
| Original | 57.30 ± 1.18 |
| Flip | 57.45 ± 0.72 |
