論文地址:https://arxiv.org/pdf/1611.04849v4.pdf
當前方法的問題
整體嵌套邊緣檢測模型(HED)明確地處理了尺度空間問題,在邊緣檢測方面比一般FCN模型有了很大的改進。然而,在HED模型中,具有深度監控的跳層結構並不能顯著提高顯著性檢測的性能。
怎么解決這個問題
觀察到 i)較深的側輸出編碼高水平的知識,可以更好地定位突出的對象;ii)較淺的側輸出捕獲豐富的空間信息。這促使作者通過在HED體系結構中引入跳躍層結構的短連接來開發一種新的顯著目標檢測方法。
基於HED的改進
在實驗中,觀察到更深的層可以更好地定位最顯著的區域,因此基於HED的架構,將另一個側輸出連接到VGGNet中的最后一個池化層。此外,由於顯著目標檢測比邊緣檢測更困難,在每側輸出中添加了另外兩個具有不同濾波通道和空間大小的卷積層。使用與HED中相同的雙線性插值操作進行上采樣。還使用一個標准的交叉熵損失來計算訓練圖像中所有像素的損失函數。
方法是基於這樣的觀察:較深的邊輸出能夠找到顯著區域的位置,但代價是丟失細節;較淺的邊輸出側重於低級特征,但缺少全局信息。這些現象激勵作者使用以下方法適當地組合不同的側面輸出,以便可以提取最具視覺特色的對象。
從功能的角度來看,架構可以看作是兩個緊密相連的階段,分別稱為顯著性定位階段和細節細化階段。顯著性定位階段的主要工作是尋找給定圖像的最顯著區域。對於細節細化階段,引入了一種自頂向下的方法,即從深度輸出層到較淺輸出層的一系列短連接。這樣考慮的原因是,借助於較深的側邊信息,較低的側邊輸出既能准確地預測顯著對象/區域,又能從較深的側邊輸出中細化結果,從而得到稠密而准確的顯著圖。
實驗結果對比