MobileNet V1 深度可分離卷積（depthwise & pointwise convolution） - 碼上快樂

相關內容簡體繁體

MobileNet V1 深度可分離卷積（depthwise & pointwise convolution）

本文轉載自查看原文 2021-03-17 15:08 497 計算機視覺-CV/ 深度學習/ Python

論文地址：

MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applicationsarxiv.org

MobileNet的核心就是Depthwise separable convolution（深度可分離卷積），它將一般的卷積過程分為了depthwise convolution（逐深度卷積）和pointwise convolution（逐點卷積），在損失一點精度的情況下，計算量大幅下降，速度更快，模型更小。

先來看看一般的卷積過程，如下圖：

輸入 $12\times 12\times 3$ 的圖像，即 $size=12\times 12,channel=3$ ，使用 $5\times 5\times 3$ 的卷積核， $stride=1$ ，無 $padding$ ，則卷積后，輸出 $8\times 8 \times 1$ 的圖像。

為了得到下圖 $channel=256$ 的輸出：

那么就需要256個卷積核（一個卷積核輸出一個channel），因此總的計算量就為 $8\times 8 \times 5 \times 5 \times 3 \times 256 = 1,228,800$ ,即一個卷積核要在輸入圖像上滑動 $8\times 8$ 個位置，每個位置進行 $5\times 5 \times 3$ 次運算，一共有 $256$ 個卷積核。

如果用 $D_K \times D_K$ 表示卷積核的尺寸， $D_F \times D_F$ 表示輸入feature map的尺寸， $M$ 表示輸入channel數， $N$ 表示輸出channel數，那么在 $stride=1$ 且有 $padding$ 的情況下，總的計算量為：

$D_K · D_K · M · N · D_F · D_F$

Depthwise separable convolution的第一步是depthwise convolution，如下圖：

將原來的 $5 \times 5 \times 3$ 的卷積核變為了3個 $5 \times 5 \times 1$ 的卷積核， $1 \times 1$ 卷積核常被用來減少channel數。每個卷積核只在輸入圖像的一個channel上操作，最后得到一個 $8 \times 8 \times 3$ 的輸出。

這一步的計算量為 $8 \times 8 \times 5 \times 5 \times 1 \times 3=4,800$

第二步是pointwise convolution，如下圖：

它使用一個 $1 \times 1 \times 3$ 的卷積核對depthwise convolution的輸出圖像進行逐點卷積，最終就得到了 $8 \times 8 \times 1$ 的輸出。

如果使用256個 $1 \times 1 \times 3$ 的卷積核就能得到 $8\times 8 \times 256$ 的輸出圖像了。

這一步的計算量為 $8 \times 8 \times 1 \times 1 \times 3 \times 256=49,152$

因此這兩步的計算量之和就為 $4,800+49,152=53,952$ ，只有原來的 $\frac{53,952}{1,228,800}=0.04390625$ 倍的計算量。

於是，用上面的符號來表示的話，那么在 $stride=1$ 且有 $padding$ 的情況下，

depthwise convolution的計算量為：

$D_F · D_F · D_k · D_k · M$

pointwise convolution的計算量為：

$D_F · D_F · M · N$

因此Depthwise separable convolution就為一般卷積計算量的：

$\frac{D_F · D_F · D_k · D_k · M + D_F · D_F · M · N}{D_K · D_K · M · N · D_F · D_F}=\frac{1}{N}+\frac{1}{D_K^2}$

現在的問題是，為什么這么做了只損失了一點精度呢？（當然，對於原本就較小的模型來說，使用Depthwise separable convolution的話參數就更少了，性能就會大幅下降而不是只下降一點了）但卷積的一些東西本來就是黑盒，我們並不知道它的詳細原理，只知道這么做是有效的。

參考

https://towardsdatascience.com/a-basic-introduction-to-separable-convolutions-b99ec3102728

編輯於 2019-12-24

原文鏈接：https://zhuanlan.zhihu.com/p/99173115

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Depthwise Separable Convolution(深度可分離卷積）的實現方式深度可分離卷積結構（depthwise separable convolution）計算復雜度分析『高性能模型』深度可分離卷積和MobileNet_v1 分組卷積和深度可分離卷積深度可分離卷積網絡關於深度可分離卷積的理解 PyTorch——深度可分離卷積（一）可分離卷積分組卷積和深度可分離卷積實現深度可分離卷積、分組卷積、擴張卷積、轉置卷積（反卷積）的理解

粵ICP備18138465號 © 2018-2025 CODEPRJ.COM