設:
圖片輸入大小為:W x W x D1
卷積核尺寸為: F x F
步長為: S
填充為:P
卷積核個數為:K
輸出圖片大小為:N x N x K
N = (W-F+2P)/ S +1
池化層的功能:
* 第一,又進行了一次特征提取,所以能減小下一層數據的處理量。
* 第二,能夠獲得更為抽象的信息,從而防止過擬合,也就是提高了一定的泛化性
* 第三,由於這種抽象性,所以能對輸入的微小變化產生更大的容忍,也就是保持了它的不變性,這里的容忍包括圖像的少量平移、旋轉縮放等操作變化。
https://www.jianshu.com/p/eb4c2f06d93d
對於一個的原圖像,通過填充
(padding)個像素,經過一個步長是
(stride)的
(filter)的卷積核,最終特征圖的尺寸為:
感性認識

總結
- 輸入大小:
- 需要4個超參數:
- 卷積核個數
- 卷積核邊長
- 步長
- 零填充的數量
- 卷積核個數
- 輸出大小:
- 參數共享,每一個卷積核有
個權重參數,共有
個權重參數和
個偏差
- 通常設置
為2的指數,如32,64,128,256,512