4.1卷積神經網絡
覺得有用的話,歡迎一起討論相互學習~
1.4Padding
- 一張\(6*6\)大小的圖片,使用\(3*3\)的卷積核設定步長為1,經過卷積操作后得到一個\(4*4\)的圖像。
特征圖大小公式
- 設定原始圖像大小為\(n*n\),卷積核大小為\(f*f\),則經過卷積操作后特征圖大小為\((n-f+1)*(n-f+1)\)
不使用Padding的缺點
- 經過卷積操作后圖像會縮小.
- 如果你注意角落邊的像素,則此像素點只會被卷積核觸碰一次。即只會在第一次卷積操作時被卷積核掃描.這意味着會丟失圖像邊緣的很多信息.
- 但是對於原始圖像中心的像素點,在每次卷積操作時都會被掃描。卷積核的感受野會掃描此位置多次.
使用Padding進行維度的填充
- 為了使每次卷積操作后大小不會丟失,使用0填充在原始圖像的外圍。
- 假設p作為填充在原始圖像外圍的Padding大小,則經過卷積操作后的特征圖大小為\((n+2p-f+1)*(n+2p-f+1)\)
Padding填充大小公式
- 如果需要使經過卷積后的特征圖大小保持不變,則填充大小需要滿足公式$$n+2p-f+1=n$$即$$p=\frac{(f-1)}{2}$$
- 所以只要f即卷積核的邊長是奇數,則能保證輸出的特征圖大小與原圖像大小相等。
通常使用奇數維度的過濾器大小
- 通常使用奇數維度的過濾器大小,這樣可以使SAME Padding后的圖像有自然的填充而不是出現小數維度。
- 奇數維度的卷積核具有中心點,便於指出過濾器的位置。
1.5卷積步長
示例
- 在此例子中選擇\(7*7\)的圖像,2作為步長,使用\(3*3\)的卷積核,最終得到一個\(3*3\)的特征圖。
特征圖大小公式
\[\lfloor\frac{(n+2p-f)}{s}+1\rfloor*\lfloor\frac{(n+2p-f)}{s}+1\rfloor \]
- 其中n為原始圖像大小,p為Padding填充維度,f為卷積核維度,s為步長
- 當出現得到的結果不是整數時,可以采用向下取整的方式使其維度為整數