Deeplab v3+ 結構的精髓:
1.繼續使用ASPP結構, SPP 利用對多種比例(rates)和多種有效感受野的不同分辨率特征處理,來挖掘多尺度的上下文內容信息. 解編碼結構逐步重構空間信息來更好的捕捉物體邊界.
2.添加新的解碼模塊,重構邊界信息
3.嘗試使用改進的xception模塊(深度可分離卷積結構depthwise separable convolution)來作為網絡的骨干,減少參數量。
結構的簡單對比:
與之前相比,加入了新的解碼模塊,逐步精確地重構物體的邊界。
其中采用的Xception模塊的深度可分離卷積結構如下:由DW+PW組成,參數量和運算成本低。
DeepLabV3+ 提出的解碼模塊,如圖:
把經過ASPP以及1*1卷積之后的編碼特征進行4倍上采樣操作,然后拼接從主干網絡中得出的相同分辨率的特征,再通過卷積以及上采樣得到結果。
圖中綠色圓圈的目的是,從編碼過程中得到的特這個可能由多個channels,所以通過1*1的卷積降低channels數目。
改進的Xception模塊:
第一個為原先的xception模塊,第二個為改進的;
改進的地方:
- 采用 depthwise separable conv 來替換所有的 max-pooling 操作,以利用 atrous separable conv 來提取任意分辨率的 feature maps.
- 在每個 3×3 depthwise conv 后,添加 BN 和 ReLU,類似於 MobileNet.
參考自:https://www.aiuai.cn/aifarm132.html