通用目標檢測-發展趨勢


(1)結合一階段二階段

  由單一階段的算法框架向一階段二階段結合的框架發展

  針對二階段需要密集的尾跡處理才能獲得盡可能多的參考箱,既費時又低效和一階段處理速度快但精度較低的問題,提出將一階段和二階段結合的方法解決這個問題,實現在保持高精確度的同時消除較多冗余的效果。如何將一階段和二階段的優點結合起來仍然是一個很大的挑戰。

 

  CVPR2020阿里達摩院發布《 Structure Aware Single-stage 3D Object Detection from Point Cloud 》,將兩階段檢測器中對特征進行細粒度刻畫的思想移植到單階段檢測中。具體來說,在訓練中利用一個輔助網絡將單階段檢測器中的體素特征轉化為點級特征,並施加一定的監督信號,同時在模型推理過程中輔助網絡無需參與計算,在保障速度的同時又提高了檢測精度。

   

  KITTI測試集的測試結果,預測的邊界框顯示為綠色。預測被投影到RGB圖像上,以獲得更好的可視化效果。

(2)視頻目標檢測

  由傳統圖片目標檢測向視頻目標檢測發展。

  針對單幀圖片不能連續反映目標運動過程且在視頻目標檢測中,運動模糊、視頻散焦、運動目標模糊、目標運動劇烈、小目標、遮擋、截斷等問題,提出視頻的運動目標和更復雜數據的目標檢測研究,實現在實際生活場景和遙感場景中都表現較好的檢測性能。深入研究運動目標和更復雜的數據(視頻)是未來研究的重點。

   

  CVPR2020微軟亞洲研究院發布《 Memory Enhanced Global-Local Aggregation for Video Object Detection 》,提出了基於記憶增強的全局-局部整合網絡(MEGA),它從全局和局部兩方面出發,共同解決視頻物體檢測的問題。先將全局特征整合到局部特征中,以解決無效的問題。后引入了新的長時記憶模塊(LRM)來解決整合規模太小的問題。

 

(3)弱/無監督目標檢測算法

  由有監督目標檢測算法向弱監督/無監督目標檢測算法發展。

  針對傳統有監督方法需要對目標進行大量類和邊界盒的標注,工作量大、對樣本敏感、處理時間長等問題,提出利用只標注對象類而不標注對象邊界盒的高比例圖像來代替大量完全標注的圖像進行訓練,弱監督目標檢測利用少量的全標注圖像來檢測大量的非全標注圖像,無監督利用自動標注技術代替人工標注。因此,發展弱監督目標檢測方法是一個值得進一步研究的重要問題。

 

  CVPR2020南京大學發布《 Rethinking the Route Towards Weakly Supervised Object Localization》,提出偽監督目標定位方法(PSOL)來解決目前弱監督目標定位方法存在的問題,該方法將定位與分類分開成兩個獨立的網絡,然后在訓練集上使用Deep descriptor transformation(DDT)生成偽GT進行訓練,整體效果達到SOTA

 

  CAM圖中,黃色框是預測框,紅色框是GT框。作者方法圖中,藍盒為DDT預測框,綠盒為回歸模型預測盒,紅盒為GT框。使用DenseNet161-Sep模型來輸出DDT和預測框

4)多任務學習

  由當前單任務學習向多任務學習轉變。

  針對當前單任務學習檢測性能低、信息利用率低等問題,提出將網絡中的多個任務聚合在一起,匯聚骨干網的多級特征的多任務學習方法提高檢測性能,同時執行多個計算機視覺任務,如目標檢測、語義分割、實例分割、邊緣檢測、高亮檢測等,豐富信息可以大幅度提高單獨任務的性能。如何保持處理速度和提高精度對研究人員提出了很大的挑戰。

   

  CVPR2019倫敦帝國學院發布《 End-to-End Multi-Task Learning with Attention》,提出了一種基於soft-attention模塊的多任務學習框架,該框架包括一個主網絡用來產生所有任務共享的feature,在此基礎上,每個任務通過soft-attention模塊從主網絡從獲取對自己有用的feature進行計算,最后達到多任務計算的效果。

 

  視覺化的第一層七類語義分割和深度估計注意特征。

  頂行:語義特征;底行:深度特征。

5)多源信息輔助

  由傳統的單一信息來源向多源信息輔助研究轉變。

  針對傳統檢測研究信息來源單一的問題,隨着社交媒體的普及和大數據技術的發展,多源信息變得容易獲取,提出多源信息輔助研究方法,許多社交媒體信息可以提供圖片和文字形式的描述,這可以幫助檢測任務。隨着各種技術的進步,融合多源信息是一個新興的研究方向。

 

6)構建終端檢測系統

  由雲端檢測向更可靠高效的終端檢測系統發展。

  針對雲端處理海量信息較慢、可靠性稍差、實時性較差的問題,提出構建終端檢測系統的想法,從雲端到終端,人工智能的終端化可以幫助人們更好更快的處理海量信息解決問題。隨着輕量級網絡的出現,終端檢測器被發展成為更高效、更可靠、應用場景更廣泛的設備。基於FPGA的芯片檢測網絡將使實時應用成為可能。

 

7)航空遙感實時檢測

  航空遙感圖像的廣泛應用使得航空遙感實時監測成為熱門方向。

  針對針對遙感圖像行人等目標目標像素非常少,難以與周圍背景區分,目標一般非常稀疏且分布不均勻,使得檢測效率非常低的問題以及地質調查、生態環境調查、抗震救災和農業領域都需要精確地分析遙感圖像的需求,自動化檢測軟件和集成硬件將給這些領域帶來前所未有的發展,將基於深度學習的目標檢測系統加載到片上系統SoC中,實現了對高空的實時檢測。

           

  CVPR2019天普大學發布《Clustered Object Detection in Aerial Images》,提出ClusDet集群檢測網絡,包括集群提議子網絡(CPNet),減少最終目標檢測塊的數量,從而達到運行時間效率高尺度估計子網絡(ScaleNet),有效提高小目標檢測檢測網絡(DetecNet),集群proposal隱式利用上下文信息,提高了檢測的准確性。

   

  聚類檢測被投影到特征映射空間,每個簇被匯集成一個固定大小的特征映射,並通過完全連接層映射成一個特征向量。網絡具有每個集群的輸出。

8)基於GAN的目標檢測

  生成對抗網絡的生成假圖像的功能使GAN成為目標檢測熱門方向。

  針對基於深度學習的系統往往需要大量的數據進行訓練的需求,利用生成對抗網絡生成假圖像的強大功能,生成大量數據樣本,實現數據擴充。將真實場景與GAN訓練目標檢測器生成的仿真數據混合,使檢測器具有更強的魯棒性和泛化能力。

   

  CVPR2020年涉及GAN網絡的應用文章至少22篇以上。香港中文大學對已經訓練好的GAN進行編輯,訓練超平面,將圖像的特征和latent code對應起來,通過編輯潛碼距離超平面的距離來控制圖像的特征信息;Facebook利用已經訓練好的styleGAN網絡,生成和單張目標圖片具有相同分布圖像,實現數據集擴增;東北大學(美)利用條件WGAN實現特征的合成,進而實現分類的數據集擴增。

  

  改變GAN模型的潛來操縱各種面部屬性。第一列PGGAN的原始合成,其他每列都顯示操作特定屬性的結果。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM