矩陣卷積后的尺寸的計算公式


設:

圖片輸入大小為:W x W x D1

卷積核尺寸為: F x F

步長為: S

填充為:P

卷積核個數為:K

輸出圖片大小為:N x N x K

        N = (W-F+2P)/ S   +1

池化層的功能:
* 第一,又進行了一次特征提取,所以能減小下一層數據的處理量。
* 第二,能夠獲得更為抽象的信息,從而防止過擬合,也就是提高了一定的泛化性
* 第三,由於這種抽象性,所以能對輸入的微小變化產生更大的容忍,也就是保持了它的不變性,這里的容忍包括圖像的少量平移、旋轉縮放等操作變化。

 

 

https://www.jianshu.com/p/eb4c2f06d93d

對於一個N\times N的原圖像,通過填充P(padding)個像素,經過一個步長是S(stride)的F\times F(filter)的卷積核,最終特征圖的尺寸為:
M = \frac{N - F + 2P}{S} + 1

感性認識

 
 

總結

  • 輸入大小:W_1\times H_1\times D_1
  • 需要4個超參數:
    • 卷積核個數K
    • 卷積核邊長F
    • 步長S
    • 零填充的數量P
  • 輸出大小:W_2\times H_2\times D_2
    • W_2 = \frac{W_1 - F + 2P}{S} + 1
    • H_2 = \frac{H_1 - F + 2P}{S} + 1
    • D_2 = K
  • 參數共享,每一個卷積核有F\times F\times D_1個權重參數,共有F\times F\times D_1\times K個權重參數和K個偏差
  • 通常設置K為2的指數,如32,64,128,256,512



免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM