Res2net：多尺度骨干網絡結構

本文轉載自查看原文 2019-04-22 13:32 3409 目標檢測

《Res2Net: A New Multi-scale Backbone Architecture》

來自：南開大學程明明組

論文：https://arxiv.org/abs/1904.01169

>多尺度的信息

首先一張圖片里物體可能有不同的大小，例如沙發和杯子就是不同大小的，第二，必要的上下文信息可能所占的面積要大於物體本身。例如，我們需要根據大桌子的信息來更好的確定桌上的是個杯子或是筆筒。第三點，對細精度分類和語義分割，理解局部，觀察不同尺度下的信息是有必要的。

Alexnet按順序堆疊卷積並得到比傳統方法取得顯著的效果。然而，由於網絡深度和卷積核大小的限制，alexnet只有很小的感受野。

VGGnet增加了網絡深度並使用更小的卷積核。更深的網絡結構可以擴大感受野，從更大的尺度提取特征。通過堆疊更多大卷積核的層，是一種更容易擴大感受野的方法。VGG比Alexnet有更少的參數更強的表達能力。但是都是線性堆疊卷積，只能表達不靈活的感受野。

Googlenet采用並行的不同尺度的卷積來增強多尺度的表達能力。但是有受限於計算資源。因此多尺度表征的策略任然沒能更大范圍的感受野。

Resnet引入短連接，因此在有更深的網絡結構的同時緩解了梯度消失的問題。特征提取的過程，短連接讓不同的不同卷積相結合。類似的，densenet里的密集連接也使得網絡能夠處理一個很大范圍的尺度。

殘差塊里頭又有殘差連接，所以取名res2net

>Res2Net的bottleneck模塊

yi表示Ki()的輸出。子特征xi和Ki-1()的輸出加在一起，然后送入Ki()。所有的分塊拼接后在送入1*1的卷積。分塊在拼接的策略能增強卷積更有效處理特征。為了在增加s的同時減少參數，我們不對x1進行卷積。更大的s一般對應更強的多尺度的表達能力。（這樣子y1,y2,y3,y4就擁有不同尺度的特征）

>Res2Net + 其他模塊