Xception: Deep Learning with Depthwise Separable Convolutions

本文轉載自查看原文 2020-03-13 09:57 749 image classification

核心貢獻：從Inception的思想：剝離時序卷積和空域卷積得到啟發，提出了Xception（Extreme Inception），希望能徹底解耦二者。

其他貢獻：

故事

Inception結構的演進：In-Network[11] => 2014年GooLeNet（V1）[20] => Inception V2[7] => Inception V3[21] => Inception-ResNet[19]。

首先我們應該知道：一般的卷積實際上是在同時完成通道互相關和空域互相關。

這是基礎。如果這一點不清楚，后面就沒法看啦。

Inception的核心思想，就是解耦這兩個操作：先做多個

Inception

看圖應該就明白了。最好能提前熟悉

補充：V3有一些變種的思想是類似的，但不一樣：它是希望解耦height-wise和width-wise的卷積，方法是級聯

上圖可以等價為下圖3所示的兩步：

既然如此，我們為什么不更進一步呢？我們讓空域卷積只在單個通道上操作，即完全不含任何通道互相關信息。如圖4：

得一提的是，TensorFlow和Keras里已經內置了類似的結構，稱為深度可分離卷積。有兩點不同：

作者將展示：第一點無關緊要，然而第二點非常重要。

Xception

36層卷積。Entry flow進行一次（8層卷積），Middle flow重復8次（24層卷積），最后是Exit flow（4層卷積）。由於是分類任務，最后跟了FC層和邏輯回歸。
一共有14個module包裹這36個卷積層。每個module都有頭尾短連接。

實驗和V3比較，並且保證參數數量基本一致。優化方法都沿襲V3的方法。

實驗結果：Xception更快、更好。

各模塊的短連接有必要：

短連接

在 depthwise 和 pointwise 卷積之間的非線性激活是不好的。取消非線性激活，可以讓收斂速度更快，效果更好：

不要非線性激活

這一點和Inception的報告是相反的。可能的原因是：Inception是將幾百個通道分成3-4份，每一份都很多。因此非線性對於這種深度學習是有幫助的。但是，Xception的空域卷積只對單通道操作，深度不足，非線性反而會讓信息丟失。

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Depthwise Separable Convolution(深度可分離卷積）的實現方式深度學習之depthwise separable convolution,計算量及參數量《DEEP LEARNING》深度可分離卷積結構（depthwise separable convolution）計算復雜度分析深度可分卷積（Depthwise Separable Conv.）計算量分析 tensorflow 之tf.nn.depthwise_conv2d and separable_conv2d實現及原理 Xception Deep learning：十六(deep networks) Xception 可分離卷積詳解及計算量 Basic Introduction to Separable Convolutions