[DeeplearningAI筆記]卷積神經網絡1.4-1.5Padding與卷積步長


4.1卷積神經網絡

覺得有用的話,歡迎一起討論相互學習~

我的微博我的github我的B站

吳恩達老師課程原地址

1.4Padding

  • 一張\(6*6\)大小的圖片,使用\(3*3\)的卷積核設定步長為1,經過卷積操作后得到一個\(4*4\)的圖像。

特征圖大小公式

  • 設定原始圖像大小為\(n*n\),卷積核大小為\(f*f\),則經過卷積操作后特征圖大小為\((n-f+1)*(n-f+1)\)

不使用Padding的缺點

  • 經過卷積操作后圖像會縮小.
  • 如果你注意角落邊的像素,則此像素點只會被卷積核觸碰一次。即只會在第一次卷積操作時被卷積核掃描.這意味着會丟失圖像邊緣的很多信息.
  • 但是對於原始圖像中心的像素點,在每次卷積操作時都會被掃描。卷積核的感受野會掃描此位置多次.

使用Padding進行維度的填充

  • 為了使每次卷積操作后大小不會丟失,使用0填充在原始圖像的外圍。
  • 假設p作為填充在原始圖像外圍的Padding大小,則經過卷積操作后的特征圖大小為\((n+2p-f+1)*(n+2p-f+1)\)

Padding填充大小公式

  • 如果需要使經過卷積后的特征圖大小保持不變,則填充大小需要滿足公式$$n+2p-f+1=n$$即$$p=\frac{(f-1)}{2}$$
  • 所以只要f即卷積核的邊長是奇數,則能保證輸出的特征圖大小與原圖像大小相等。

通常使用奇數維度的過濾器大小

  • 通常使用奇數維度的過濾器大小,這樣可以使SAME Padding后的圖像有自然的填充而不是出現小數維度。
  • 奇數維度的卷積核具有中心點,便於指出過濾器的位置。

1.5卷積步長

示例

  • 在此例子中選擇\(7*7\)的圖像,2作為步長,使用\(3*3\)的卷積核,最終得到一個\(3*3\)的特征圖。

特征圖大小公式

\[\lfloor\frac{(n+2p-f)}{s}+1\rfloor*\lfloor\frac{(n+2p-f)}{s}+1\rfloor \]

  • 其中n為原始圖像大小,p為Padding填充維度,f為卷積核維度,s為步長
  • 當出現得到的結果不是整數時,可以采用向下取整的方式使其維度為整數


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM