(1)Speed/accuracy trade-offs for modern convolutional object detectors
其主要考慮三種檢測器(Faster RCNN,R-FCN,SSD)作為元結構,三種CNN網絡(VGG,Inception,ResNet)作為特征提取器,變化其他參數如圖像分辨率、proposals數量等,研究目標檢測系統准確率與速度的權衡關系。
(2)YOLO9000:Better, Faster, Stronger
其為YOLO升級版,其對YOLO方法作了一些改進,Better方面考慮(Batch Normalization, High Resolution, Anchor Boxes, Dimension Clusters, Direct location prediction, Fine-Grained Features, Multi-Scale Training),Faster方面提出一個新的Darknet-19結構。除此之外,其提出一個方法在目標檢測數據集與圖像分類數據集上聯合訓練,主要構建了一個視覺內容分層樹結構WordTree。
(3)A-Fast-RCNN: Hard positive generation via adversary for object detection
其主要考慮學習一個對於遮擋和形變具有不變性的目標檢測器,收集各種狀態目標的大數據集的數據驅動策略存在一定問題,比如遮擋和形變服從長尾理論,因此提出學習一個對抗網絡(ASTN,ASDN)生成具有遮擋和形變的困難樣本,通過生成器與檢測器的博弈,提升目標檢測器對於各種狀態物體的整體目標檢測性能。
(4)Feature Pyramid Networks for Object Detection
其主要考慮利用深度卷積網絡固有的多尺度金字塔形層次結構來構建特征金字塔,創建了一個具有橫向連接的自頂向下架構用於在所有尺度上構建高級語義特征圖,FPN作為通用特征提取器表現優異,論文研究表明,盡管深度ConvNets具有強大的表達能力和對尺度變化內在的魯棒性,使用金字塔表示來明確地解決多尺度問題仍然是重要的。
(5)RON: Reverse Connection with Objectness Prior Networks for Object Detection
其主要考慮兩個問題,多尺度目標定位和負樣本挖掘,並分別提出Reverse Connection使得網絡能在CNN多尺度檢測目標和Objectness Prior減少目標的搜索空間,最后通過多任務損失聯合優化Reverse Connection、Objectness Prior和目標檢測器。
(6)Accurate Single Stage Detector Using Recurrent Rolling Convolution
其提出一個新型端到端訓練目標檢測網絡,在多尺度特征圖引入Recurrent Rolling Convolution結構創建“deep in context”的分類器和回歸器,其主要也是考慮“top-down/bottom-up”的特征集成。
(7)Mimicking Very Efficient Network for Object Detection
當前目標檢測器都需要從預訓練ImageNet分類模型初始化,其相比從零開始訓練能達到更好的效果,而預訓練圖像分類模型對於檢測任務並非最優的,其主要考慮訓練高效檢測器而不需要ImageNet的預訓練。其研究已有的一個滿足檢測表現的網絡如何指導其他網絡的訓練,即利用一個檢測網絡監督另一個更高效的網絡並保持准確率,其提出特征mimic技術。
(8)Perceptual Generative Adversarial Networks for Small Object Detection
小目標因其低分辨率和噪聲表示檢測困難,現有方法主要考慮在多尺度學習所有目標的特征表示,其受限於計算復雜度。其主要考慮建立單個架構來解決小目標檢測問題,該架構將小目標的表示提升到“super-resolved”,從而實現與大目標類似的特征,從而對於檢測任務更加具有辨別能力。利用生成式對抗網絡,其提出Perceptual GAN模型,通過縮小小目標與大目標的表示差異來改善小目標檢測。