dilated convolutions：擴張卷積

本文轉載自查看原文 2018-07-12 17:33 5225

最近在閱讀《Context Encoding for Semantic Segmentation》中看到應用了dilated convolutions。

擴張卷積與普通的卷積相比，除了卷積核的大小以外，還有一個擴張率(dilation rate)參數，主要用來表示擴張的大小。擴張卷積與普通卷積的相同點在於，卷積核的大小是一樣的，在神經網絡中即參數數量不變，區別在於擴張卷積具有更大的感受野。感受野是卷積核在圖像上看到的大小，例如 $3 \times 3$

$3 \times 3$

擴展卷積在保持參數個數不變的情況下增大了卷積核的感受野，同時它可以保證輸出的特征映射（feature map）的大小保持不變。一個擴張率為2的3×3卷積核，感受野與5×5的卷積核相同，但參數數量僅為9個，是5×5卷積參數數量的 $36 %$

$36 %$

作者：譚旭
鏈接：https://www.zhihu.com/question/54149221/answer/192025860
來源：知乎
著作權歸作者所有。商業轉載請聯系作者獲得授權，非商業轉載請注明出處。

deconv的其中一個用途是做upsampling，即增大圖像尺寸。而dilated conv並不是做upsampling，而是增大感受野。

可以形象的做個解釋：

對於標准的k*k卷積操作，stride為s，分三種情況：

(1) s>1，即卷積的同時做了downsampling，卷積后圖像尺寸減小；

(2) s=1，普通的步長為1的卷積，比如在tensorflow中設置padding=SAME的話，卷積的圖像輸入和輸出有相同的尺寸大小；

(3) 0<s<1，fractionally strided convolution，相當於對圖像做upsampling。比如s=0.5時，意味着在圖像每個像素之間padding一個空白的像素后，stride改為1做卷積，得到的feature map尺寸增大一倍。

而dilated conv不是在像素之間padding空白的像素，而是在已有的像素上，skip掉一些像素，或者輸入不變，對conv的kernel參數中插一些0的weight，達到一次卷積看到的空間范圍變大的目的。

當然將普通的卷積stride步長設為大於1，也會達到增加感受野的效果，但是stride大於1就會導致downsampling，圖像尺寸變小。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 擴張卷積（dilated convolution）吃透空洞卷積（Dilated Convolutions）因果卷積（causal）與擴展卷積（dilated）【33】卷積步長講解(Strided convolutions) 論文翻譯：2020_Densely connected neural network with dilated convolutions for real-time speech enhancement in the time domain 可分離卷積詳解及計算量 Basic Introduction to Separable Convolutions Face completion with Hybrid Dilated Convolution Image Inpainting for Irregular Holes Using Partial Convolutions 卷積、反卷積與膨脹卷積 jquery 時間運算、格式化的方法擴張