顯著目標檢測思路


轉自http://www.360doc.com/content/14/0725/09/10724725_396891787.shtml

1、顯著目標檢測介紹

 

 

顯著性檢測最近幾年成了研究熱點,從計算機視覺三大會議(ICCV, CVPR, ECCV)上的文章數量就可以看出,大概每屆會議都有10來篇的樣子,一個這么小的topic,10來篇數量已經很多了。如果你看一看這些文章就會發現,顯著目標檢測的占了大部分,眼動點預測的很少,大概就一兩篇。看到這,有些人也許還不明白顯著目標檢測和眼動點預測區別。其實,顯著目標檢測就類似於一個二值分割問題,只不過加了顯著這個條件約束;而眼動點預測則是提取出人眼感興趣的一些點,而不是提取出顯著的整個目標區域,也就是說有些像素哪怕是在顯著目標上,它也可能不吸引人的眼球。那么為什么顯著目標檢測文章最近幾年這么多呢?究其原因,我個人認為首要就是這個topic簡單,不需要太深的數學理論,而且不需要生理方面的研究基礎(眼動點預測更側重人腦的生理方面),容易出文章,誰都可以搞一搞;然后,顯著目標檢測的應用在計算機視覺上更直接一些,包括圖像分割,也就是saliency作為prior,來指導segmentation,來實現unsupervised segmentation。然后,就是圖像分類了,可以利用saliency來提高feature的discrimination,如利用saliency來指導sparse code等等吧;最后,就是大牛們itti和borji等的持續push,寫了很多的benchmark文章,當然更多是在眼動點預測方面,也有ECCV12關於salient object detection的benchmark。現在的要發個top,最好要和ECCV12 benchmark上的top ranked算法在提到的幾個database上比較一下。不過,一個topic持續的發熱一段時間以后,很多人發現,顯著目標檢測也越來越難做了,沒有idea了,能想到的,都被用了。那么,我接下來就來講一講怎樣繼續做顯著目標檢測的研究。

 

 

 

2、顯著目標檢測的研究思路

 

 

 

第一,借鑒其他相關問題的解決思路來做saliency

 

 

 

我先來介紹一下和salient object detection最相關的兩個問題:

 

 

 

1、Segmentation

 

– Figure/ground segmentation or matting
– Image segmentation or clustering
– Semantic segmentation or image parsing

 

 

 

2、Object detection and recognition

 

– Class-independent object detection and recognition
– Class-specific object detection and recognition

 

接下來,我就舉一些例子,來說明怎樣從這些相關領域來得到啟發

 

 

 

第一個例子就是MSRA的yichen wei等ECCV12 Geodesic saliency,這篇文章的主要是利用boundary prior和測地距離來進行顯著性檢測。而相似的思路也應用於segmentation中,如Geodesic Graph Cut for Interactive Image Segmentation, CVPR 10,就是利用和人為標記的一些先驗區域的測地距離,來衡量像素屬於目標或者背景可能性,當我們把人為標定的先驗區域,用boundary prior替代,就可以實現bottom-up的saliency detection了。而boundary prior在Constrained Parametric Min-Cuts for Automatic Object Segmentation, CVPR 10,也已用到,就是利用boundary prior來指導分割的。

 

 

 

第二個例子就是CVPR13的Salient Object Detection: A Discriminative Regional Feature Integration Approach。相似的思路,也在Constrained Parametric Min-Cuts for Automatic Object Segmentation, CVPR 10中,用來進行segmentation。不同的是一個處理的是region,一個是binary segment。處理region的好處,就是可以加上center-surround等各種saliency的機制。

 

 

 

第三個例子CVPR13的 Saliency aggregation。文章主要是利用local learning的思想,就是說類內差異性,導致一個針對整幅圖像庫的model不可能對每個圖像都好,所以他就對每個圖像訓練了一個local model。相似的思路,在Object recognition有很多,如Extracting Foreground Masks towards Object Recognition, ICCV 11. 另外, CVPR13 Looking beyond image saliency, 也采用了類似的idea。

 

 

 

第二,利用一些新的技術來進行顯著性檢測

 

 

 

我們可以借用machine learning方面一些技術,比如說,sparse code,pca,manifold learning,ranking,graph model等來做saliency。這些idea容易搞,就是把一些技術應用到saliency上來。舉幾個例子,CVPR13的 manifold ranking saliency, pca saliency等,ICCV13 的 Contextual Hypergraph Modelling for Salient Object Detection 等。

 

 

 

3、以后研究思路

 

 

 

我覺得以后的salient object detection可以沿着幾個思路做一些。

 

第一,可以在速度方面做一些工作,畢竟salient object detection 自己幾乎沒啥用,就是做一些高級應用的pre-processing。

 

 

 

第二,可以做一些sparse code的saliency研究,貌似sparse code在很多方面都要火一陣,比如classification,tracking,super-resolution, denoise等等,是不是在saliency也要火一陣,貌似sparse code的效果還不太好。ICCV13 huchuan lu有一篇 sparse code,效果還不錯。

 

 

 

第三,多用一些prior來做saliency。比如可以利用inter-image or out-image等的prior來把saliency這個ill-posed問題轉化為well-posed。這是個很好的方向,比如我們可以學習統計的prior或者發現新的prior,相關的思路在segmentation也有了,比如CVPR 13Robust Region Grouping via Internal Patch Statistics 和 ACM MM10 的 Image segmentation with patch-pair density priors。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM