論文閱讀:BASNet: Boundary-Aware Salient Object Detection


論文地址:http://openaccess.thecvf.com/content_CVPR_2019/papers/Qin_BASNet_Boundary-Aware_Salient_Object_Detection_CVPR_2019_paper.pdf

當前方法的問題

   基於FCN的方法在精細結構或邊界上仍有缺陷。

  精確顯著物體檢測的挑戰:1)顯著性主要定義在整個圖像的全局對比度上,而不是局部或像素特征上。為了獲得准確的檢測結果,發展的顯著性檢測方法必須了解整個圖像的全局意義和物體的詳細結構。為了解決這個問題,需要聚合多層深度特征的網絡。2)大多數顯著目標檢測方法都是用交叉熵作為訓練損失,但是,經過CELoss訓練的模型通常對邊界像素的區分置信度較低,導致邊界模糊。其他損失函數,如IoU Loss,F-measure Loss 和 Dice-score Loss 是針對有偏的訓練集提出的,但他們不是專門為了獲得精細的結構而設計的。

 

怎么解決這個問題

  1)BASNet,同時捕獲全局和局部的上下文信息。

  2)新的損失(BCE+SSIM+IoU),獲得高置信度顯著圖和清晰邊界。

 

網絡結構

   

  預測模塊:設計成編解碼網絡,因為這種結構能同時捕獲高層次的全局上下文和低層次的細節。編碼器有一個輸入卷積層和由基本res塊組織稱的六部分。為了更進一步捕捉全局信息,在編碼器和解碼器之間加了一個橋接塊,包含三個卷積層。解碼器與編碼器基本對稱,每個階段的輸入是解碼器的前一階段的上采樣和編碼器相應階段輸出的級聯。取最后一層精度最高的圖作為預測模塊的輸出。

  優化模塊:通過殘差塊優化粗糙的顯著圖。粗糙包括:1)模糊有噪聲的邊界;2)不均勻預測的區域概率。實際的粗糙預測圖兩種都包含。殘差優化模塊最初被提出用來用於邊界優化,然而,由於設計的模塊很淺,難以捕獲高級信息進行優化。RRM采用殘差編解碼器架構,包含輸入層,編碼器,橋接層,解碼器和輸出層,編碼器和解碼器包含4個階段,每個階段只有一個卷積層。

 

損失函數

  總的損失等於每個輸出圖的損失的加權和。共有8個輸出,7個來自預測模塊,1個來自優化模塊。

  

   每層的損失包括三個部分:BCE loss、SSIM loss 和 IoU loss。

  

  BCE loss的定義:

  

   SSIM loss 最初被用於圖像質量評估,捕捉圖像中的結構信息,定義如下:

  

   IoU 最初是用來度量兩個j和的相似性的,然后被用作目標檢測和分割的標准評價評估度量,這里采用的IoU loss 定義如下:

  

 

實驗結果

  與其他方法的結果對比。

  


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM