Architecture
Depthwise Separable Convolution
MobileNet是基於深度可分離卷積的。通俗的來說,深度可分離卷積干的活是:把標准卷積分解成深度卷積(depthwise convolution)和逐點卷積(pointwise convolution)。這么做的好處是可以大幅度降低參數量和計算量。分解過程示意圖如下:
Network Structure and Training
標准卷積和MobileNet中使用的深度分離卷積結構對比如下:
MobileNetv2:Abstract
本文提出了一種新的移動架構MobileNetv2,改善了多個任務和基准的State-of-the-art水平。同時我們介紹了一種基於此框架的面向目標檢測任務的有效應用模型SSDLite。此外,我們介紹了簡化移動語義分割模型DeepLabv3構建新的Mobile DeepLabv3.
MobileNetv2架構是基於倒置殘差結構(inverted residual structure),原本的殘差結構的主分支是有三個卷積,兩個逐點卷積通道數較多,而倒置的殘差結構剛好相反,中間的卷積通道數(依舊使用深度分離卷積結構)較多,旁邊的較小。此外,我們發現去除主分支中的非線性變換是有效的,這可以保持模型表現力。論文在ImageNet classification, COCO object detection, VOC image segmentation上做了對比實驗,驗證了該架構的有效性。