每個卷積核具有長、寬、深三個維度。
卷積核的長、寬都是人為指定的,長X寬也被稱為卷積核的尺寸,常用的尺寸為3X3,5X5等;
卷積核的深度與當前圖像的深度(feather map的張數)相同,所以指定卷積核時,只需指定其長和寬兩個參數。
例如,在原始圖像層 (輸入層),如果圖像是灰度圖像,其feather map數量為1,則卷積核的深度也就是1;如果圖像是grb圖像,其feather map數量為3,則卷積核的深度也就是3.
卷積核個數的理解
如下圖紅線所示:該層卷積核的個數,有多少個卷積核,經過卷積就會產生多少個feature map,也就是下圖中 `豆腐皮兒`的層數、同時也是下圖`豆腐塊`的深度(寬度)!!這個寬度可以手動指定,一般網絡越深的地方這個值越大,因為隨着網絡的加深,feature map的長寬尺寸縮小,本卷積層的每個map提取的特征越具有代表性(精華部分),所以后一層卷積層需要增加feature map的數量,才能更充分的提取出前一層的特征,一般是成倍增加(不過具體論文會根據實驗情況具體設置)!
例如輸入224x224x3(rgb三通道),輸出是32位深度,卷積核尺寸為5x5。
那么我們需要32個卷積核,每一個的尺寸為5x5x3(最后的3就是原圖的rgb位深3),每一個卷積核的每一層是5x5(共3層)分別與原圖的每層224x224卷積,然后將得到的三張新圖疊加(算術求和),變成一張新的feature map。 每一個卷積核都這樣操作,就可以得到32張新的feature map了。 也就是說:
不管輸入圖像的深度為多少,經過一個卷積核(filter),最后都通過下面的公式變成一個深度為1的特征圖。不同的filter可以卷積得到不同的特征,也就是得到不同的feature map。
原文鏈接:https://blog.csdn.net/xys430381_1/article/details/82529397
