基於Pre-Train的CNN模型的圖像分類實驗


基於Pre-Train的CNN模型的圖像分類實驗

 

 

 MatConvNet工具包提供了好幾個在imageNet數據庫上訓練好的CNN模型,可以利用這個訓練好的模型提取圖像的特征。本文就利用其中的 “imagenet-caffe-ref”的模型,提取圖像特征(softmax前一層的輸出,4096維),在幾個常用的圖像分類的數據庫中進行了相應的分類實驗。這實驗的過程中,有對圖片進行左右翻轉用於增加訓練數據。下面結果的表格中:Original原始結果,Flip增加翻轉后的結果。
需要用到的toolbox及模型:
liblinear: 用於訓練SVM, 實驗中采用linear SVM 以及 c=1
 
數據庫及相應的實驗結果:
1.  Caltech-101以及Caltech-256
    隨機的重復進行10次實驗,取分類的結果的平均值,Training Images是每一個類別使用的訓練圖片數目。
 
Caltech-101
 Training Images  5  10  15  20  25  30
 Original  76.73 ± 0.79  82.06 ± 0.36  84.10 ± 0.69  85.32 ± 0.50  86.26 ± 0.44 86.96 ± 0.89 
 Flip 76.60 ± 0.49   82.09 ± 0.45  83.91 ± 0.49  85.46 ± 0.38  86.11 ± 0.34  86.98 ± 0.93
 
Caltech-256
 Training Images  15  30  45  60
 Original  63.76 ± 0.41  67.81 ± 0.56  69.71 ± 0.48  70.84 ± 0.69
 Flip  63.72 ± 0.51  67.74 ± 0.54  69.65 ± 0.76  70.75 ± 0.59
 
2.  Oxford flowers-102
  flowers-102是一個用於花卉精細分類的數據庫,數據庫提供了Train,Validation,Test的集合。在實驗過程中,直接使用(Train+Validation)進行訓練,Test進行測試。
 Original  84.50
 Flip  85.14
 
3.  Scene-15
    Scene-15是一個包含15類場景的數據,實驗采用的每一場景取100張圖片做訓練,其余的做測試。重復進行10次實驗
 Original  86.87 ± 0.75
 Flip  87.00 ± 0.41
 
4.  UC Merced Land Use Dataset
   UC Merced Land Use Dataset是一個包含21類場景遙感衛星圖像分類數據庫(每個類別100張圖片),實驗采用的80訓練,20測試,重復10次。
 Original  94.90 ± 0.95
 Flip  95.14 ± 1.05
 
5. Flickr Material
  Flickr Materia是一個關於材料的數據庫,包含10種不同的材料(每種100張圖片),實驗采用50張做訓練,剩下的50張做測試,重復10次實驗。數據庫還提供每一張圖片的Mask,本實驗沒有考慮Mask
 Original  64.04 ± 2.20
 Flip  62.96 ± 1.54
6. UIUC Sports
  UIUC Sports是一個包含8中運動類別的數據集,實驗過程中,每一個類別取100張圖片做訓練,其余的做測試。重復進行10次。
 Original  94.88 ± 1.02
 Flip  95.34 ± 0.83
7. MIT Scene
  MIT Scene包含有67個室內場景,實驗過程中,每一個類別取80張圖片做訓練,其余的做測試。重復進行10次。
 Original  57.30 ± 1.18
 Flip  57.45 ± 0.72


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM