U2-Net網絡學習筆記(記錄)


論文地址:http://www.arxiv.org/pdf/1505.04597.pdf

該設計有以下兩點優勢:
(1)它能夠捕捉更多的上下文信息,因為提出了RSU(ReSidual U-blocks)結構,融合了不同尺度的感受野的特征;
(2)它增加了整個架構的深度但並沒有顯著增加計算成本,因為在這些RSU塊中使用了池化操作。

  這種架構使能夠從頭開始訓練深度網絡,而無需使用圖像分類任務中的backbone。
現有網絡:

  注重利用現有的主干提取深層特征,比如Alexnet, VGG, ResNet, ResNeXt, DenseNet等。這些主干最終都是為圖像分類任務而設計的,他們提取的特征代表語義,而不是局部細節和全局對比信息,但這對顯著性檢測至關重要。他們需要在ImageNet數據集上進行預訓練,如果目標數據與ImageNet具有不同的分布,則會比較低效。

  存在一些問題:

  • 網絡結構復雜,這是由於在現有主干網絡上添加特征聚合模塊,從這些模型中提取多層顯著性特征;
  • 現有主干網絡通常通過犧牲高分辨率的特征映射來實現更深層次的體系結構。

U2Net網絡解決的問題:

  第一,該網絡是一個兩層嵌套的U型結構,沒有使用圖像分類的預訓練主干模型,可以從頭訓練;
  第二,新的體系結構允許網絡更深入、獲得高分辨率,而不會顯著增加內存和計算成本。在底層,設計了一個新的RSU,能夠在不降低特征映射分辨率的情況下提取級內多尺度特征;在頂層,有一個類似於U-Net的結構,每一stage由一個RSU塊填充。

RSU構成:

 

 


為介紹RSU,論文中與殘差網絡進行對比:

 

 

 其中U代表的就是在輸入上提取和編碼多尺度特征。

兩層嵌套的U型結構:嵌套的U結構可以更有效的提取stage內的多尺度特征和聚集階段的多層次特征。

更加詳細見:(2條消息) U2Net論文解讀及代碼測試_ling620的專欄-CSDN博客_u2net

代碼參考:Github 項目 - U2Net 網絡及實現 - AI備忘錄 (aiuai.cn)


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM