輕量化模型：MobileNet v2

本文轉載自查看原文 2019-06-18 15:18 425 輕量化網絡

MobileNet v2 論文鏈接：https://arxiv.org/abs/1801.04381

MobileNet v2是對MobileNet v1的改進，也是一個輕量化模型。

關於MobileNet v1的介紹，請看這篇：對MobileNet網絡結構的解讀

MobileNet v1遺留下的問題

1）結構問題

MobileNet v1的結構非常簡單，是一個直筒結構，這種結構的性價比其實不高，后續一系列的ResNet，DenseNet等結構已經證明通過復用圖像特征，使用Concat/Eltwise+等操作進行特征融合，能極大提升網絡的性價比。

Concat(張量拼接)：比如26*26*128，26*26*256經過拼接（Concat）之后得到（26*26*384）

Eltwise有三個操作：product（點乘），sum（相加減）和max（取最大值），其中sum是默認操作

2）Depthwise Convolution的潛在問題

Depthwise Convolution確實是降低了計算量，而在NxN Depthwise + 1x1 Pointwise的結構在性能上也接近NxN Conv。在實際使用中發現，Depthwise的部分kernel比較容易訓廢掉：訓練完之后發現Depthwise訓出來的kernel有不少是空的。當時我們認為，Depthwise每個kernel dim相對於普通Conv要小得多，過小的kernel_dim，加上ReLU的激活影響下，使得神經元輸出很容易變為0，所以學廢了。ReLU對於0的輸出梯度為0，所以一旦陷入0輸出，就沒法恢復了。我們還發現，這個問題在定點化低精度的時候會進一步放大。

MobileNet v2的創新點

1. Inverted residuals，通常的residuals block（殘差塊）是先經過1*1的Conv layer，把feature map的通道數"壓"下來，再經過3*3Conv layer，最后經過一個1*1的Conv layer，將feature map通道數再"擴展"回去。即先"壓縮"，最后"擴張"回去。

而Inverted residuals就是先"擴張"，最后"壓縮"，后面會有介紹。

2. Linear bottlenecks，為了避免ReLU對特征的破壞。

MobileNet v2和v1之間的區別