評論文章分類:
[1] D. Geronimo, and A. M.Lopez. Vision-based Pedestrian Protection Systems for Intelligent Vehicles, BOOK, 2014.
[2] P.Dollar, C. Wojek,B. Schiele, et al. Pedestrian detection: an evaluation of the state of the art [J].IEEE Transactions on PatternAnalysis andMachine Intelligence, 2012, 34(4): 743-761.
[3]蘇松志, 李紹滋, 陳淑媛等. 行人檢測技術綜述[J]. 電子學報, 2012, 40(4): 814-820.
[4]M. Enzweiler, and D.Gavrila. Monocular pedestrian detection: survey and experiments [J]. IEEE Transactions on Pattern Analysis andMachine Intelligence, 2009, 31(12): 2179-2195.
[5] D. Geronimo, A. M.Lopez and A. D. Sappa, et al. Survey of pedestrian detection for advanced driverassistance systems [J]. IEEE Transactionson Pattern Analysis and Machine Intelligence, 2010, 32(7): 1239-1258.
[6]賈慧星, 章毓晉.車輛輔助駕駛系統中基於計算機視覺的行人檢測研究綜述[J], 自己主動化學報, 2007, 33(1): 84-90.
[7] 許言午, 曹先彬,喬紅. 行人檢測系統研究新進展及關鍵技術展望[J], 電子學報, 2008, 36(5): 368-376.
[8] 杜友田; 陳峰;徐文立; 李永彬;基於視覺的人的運動識別綜述, 電子學報, 2007. 35(1): 84-90.
[9]朱文佳. 基於機器學習的行人檢測關鍵技術研究[D]. 第一章, 碩士學位論文, 上海交通大學. 2008. 指導教師: 戚飛虎.
2014_ECCV_30Hz Object Detection with DPM V5
2014_ECCV_Knowing a good HOG filter whenyou see it: Efficient selection of filters for detection
2014_ECCV_Unsupervised Dense ObjectDiscovery, Detection, Tracking and Reconstruction
2014_ECCV_Comparing Salient ObjectDetection Results without Ground Truth
2014_ECCV_RGBD Salient Object Detection: ABenchmark and Algorithms
2014_ECCV_Saliency Detection with Flash andNo-flash Image Pairs
2014_ECCV_Object Co-Detection via EfficientInference in a Fully-Connected CRF
2014_ECCV_Context as Supervisory Signal:Discovering Objects with Predictable Contex
2014_ECCV_Object Detection and ViewpointEstimation with Auto-masking Neural Network
2014_ECCV_Deep Learning of Scene-specificClassifier for Pedestrian Detection
2014_ECCV_Spatio-Temporal Object DetectionProposals
2014_ECCV_Strengthening the Effectivenessof Pedestrian Detection with Spatially Pooled Features
2014_ECCV_Video Object Discovery andCo-segmentation with Extremely Weak Supervision
2014_ECCV_Face detection without bells andwhistles
2014_ECCV_Human Detection using LearnedPart Alphabet and Pose Dictionary
2014_ECCV_SPADE: Scalar Product Acceleratorby Integer Decomposition for Object Detection
2014_ECCV_Towards UnifiedObject Detection and Segmentation
2014_ECCV_Depth Based Object Detection fromPartial Pose Estimation of Symmetric Objects
2014_ECCV_Training Deformable Object Modelsfor Human Detection based on Alignment and Clustering
2014_ECCV_Spatio-temporal Matching forHuman Detection in Video
2014_ECCV_Facial Landmark Detection by DeepMulti-task Learning
2014_ECCV_Latent-Class Hough Forests for 3DObject Detection and Pose Estimation
2014_ECCV_GIS-assisted Object Detection andgeospatial localization
2014_ECCV_Sliding Shapes for 3D Object Detectionin Depth Images
2014_ECCV_Integrating Context and Occlusionfor Car Detection by Hierarchical And-Or Model
2014_ECCV_Simultaneous Detection andSegmentation
2014_ECCV_Learning Rich Features from RGB-DImages for Object Detection and Segmentation
2014_ITS_Toward real-time pedestrian detection based on a deformable template model
2014_PAMI_Scene-specific pedestrian detection for static video surveillance
2014_CVPR_Pedestrian Detection in Low-resolution Imagery by Learning Multi-scale Intrinsic Motion Structures (MIMS)
2014_CVPR_Switchable Deep Network for Pedestrian Detection
2014_CVPR_Informed Haar-like Features Improve Pedestrian Detection
2014_CVPR_Word Channel Based Multiscale Pedestrian Detection Without Image Resizing and Using Only One Classifier
2013_BMVC_Surveillance camera autocalibration based on pedestrian height distribution
2013_Virtual and real world adaptation for pedestrian detection
2013_Search space reduction in pedestrian detection for driver assistance system based on projective geometry
2013_CVPR_Robust Multi-Resolution Pedestrian Detection in Traffic Scenes
2013_CVPR_Optimized Pedestrian Detection for Multiple and Occluded People
2013_CVPR_Pedestrian Detection with Unsupervised and Multi-Stage Feature Learning
2013_CVPR_Single-Pedestrian Detection aided by Multi-pedestrian Detection
2013_CVPR_Modeling Mutual Visibility Relationship in Pedestrian Detection
2013_CVPR_Local Fisher Discriminant Analysis for Pedestrian Re-identification
二、DataSets
MIT數據庫
該數據庫為較早公開的行人數據庫,共924張行人圖片(ppm格式。寬高為64x128)。肩到腳的距離約80象素。該數據庫僅僅含正面和背面兩個視角。無負樣本,未區分訓練集和測試集。
Dalal等採用“HOG+SVM”。在該數據庫上的檢測准確率接近100%。
INRIA數據庫
該數據庫是眼下使用最多的靜態行人檢測數據庫,提供原始圖片及對應的標注文件。訓練集有正樣本614張(包括2416個行人)。負樣本1218張。測試集有正樣本288張(包括1126個行人)。負樣本453張。圖片中人體大部分為站立姿勢且高度大於100個象素,部分標注可能不對。圖片主要來源於GRAZ-01、個人照片及google,因此圖片的清晰度較高。在XP操作系統下部分訓練或者測試圖片無法看清晰,但可用OpenCV正常讀取和顯示。
Daimler行人數據庫
該數據庫採用車載攝像機獲取,分為檢測和分類兩個數據集。
檢測數據集的訓練樣本集有正樣本大小為18x36和48x96的圖片各15560(3915x4)張,行人的最小高度為72個象素;負樣本6744張(大小為640x480或360x288)。
測試集為一段27分鍾左右的視頻(分辨率為640x480),共21790張圖片,包括56492個行人。
分類數據庫有三個訓練集和兩個測試集。每一個數據集有4800張行人圖片。5000張非行人圖片,大小均為18x36,另外還有3個輔助的非行人圖片集。各1200張圖片。
Caltech行人數據庫
該數據庫是眼下規模較大的行人數據庫。採用車載攝像頭拍攝,約10個小時左右,視頻的分辨率為640x480,30幀/秒。標注了約250,000幀(約137分鍾)。350000個矩形框。2300個行人。另外還對矩形框之間的時間相應關系及其遮擋的情況進行標注。
數據集分為set00~set10,當中set00~set05為訓練集,set06~set10為測試集(標注信息尚未公開)。性能評估方法有下面三種:(1)用外部數據進行訓練,在set06~set10進行測試。(2)6-fold交叉驗證,選擇當中的5個做訓練。另外一個做測試,調整參數,最后給出訓練集上的性能;(3)用set00~set05訓練,set06~set10做測試。因為測試集的標注信息沒有公開。須要提交給Pitor Dollar。結果提交方法為每30幀做一個測試。將結果保存在txt文檔中(文件的命名方式為I00029.txt I00059.txt ……)。每一個txt文件里的每行表示檢測到一個行人,格式為“[left, top,width, height, score]”。假設沒有檢測到不論什么行人,則txt文檔為空。該數據庫還提供了對應的Matlab工具包,包含視頻標注信息的讀取、畫ROC(Receiver Operatingcharacteristic Curve)曲線圖和非極大值抑制等工具。
TUD行人數據庫
TUD行人數據庫為評估運動信息在行人檢測中的作用。提供圖像對以便計算光流信息。訓練集的正樣本為1092對圖像(圖片大小為720x576,包括1776個行人)。負樣本為192對非行人圖像(手持攝像機85對,車載攝像機107對)。另外還提供26對車載攝像機拍攝的圖像(包括183個行人)作為附加訓練集。
測試集有508對圖像(圖像對的時間間隔為1秒,分辨率為640x480)。共同擁有1326個行人。Andriluka等也構建了一個數據庫用於驗證他們提出的檢測與跟蹤相結合的行人檢測技術。該數據集的訓練集提供了行人的矩形框信息、切割掩膜及其各部位(腳、小腿、大腿、軀干和頭部)的大小和位置信息。
測試集為250張圖片(包括311個全然可見的行人)用於測試檢測器的性能。2個視頻序列(TUD-Campus和TUD-Crossing)用於評估跟蹤器的性能。
NICTA行人數據庫
該數據庫是眼下規模較大的靜態圖像行人數據庫,25551張含單人的圖片,5207張高分辨率非行人圖片,數據庫中已分好訓練集和測試集,方便不同分類器的比較。
Overett等用“RealBoost+Haar”評估訓練樣本的平移、旋轉和寬高比等各種因素對分類性能的影響:(1)行人高度至少要大於40個象素;(2)在低分辨率下,對於Haar特征來說。添加樣本寬度的性能好於添加樣本高度的性能。(3)訓練圖片的大小要大於行人的實際大小。即背景信息有助於提高性能。(4)對訓練樣本進行平移提高檢測性能,旋轉對性能的提高影響不大。
以上的結論對於構建行人數據庫具有非常好的指導意義。
ETH行人數據庫
Ess等構建了基於雙目視覺的行人數據庫用於多人的行人檢測與跟蹤研究。該數據庫採用一對車載的AVT Marlins F033C攝像頭進行拍攝。分辨率為640x480,幀率13-14fps,給出標定信息和行人標注信息,深度信息採用置信度傳播方法獲取。
CVC行人數據庫
該數據庫眼下包括三個數據集(CVC-01、CVC-02和CVC-Virtual)。主要用於車輛輔助駕駛中的行人檢測研究。
CVC-01[Geronimo,2007]有1000個行人樣本,6175個非行人樣本(來自於圖片中公路區域中的非行人圖片。不像有的行人數據庫非行人樣本為天空、沙灘和樹木等自然圖像)。CVC-02包括三個子數據集(CVC-02-CG、CVC-02-Classification和CVC-02-System),分別針對行人檢測的三個不同任務:感興趣區域的產生、分類和系統性能評估。圖像的採集採用Bumblebee2立體彩色視覺系統,分辨率640x480,焦距6mm,對距離攝像頭0~50m的行人進行標注。最小的行人圖片為12x24。
CVC-02-CG主要針對候選區域的產生。有100張彩色圖像,包括深度和3D點信息。CVC-02-Classification主要針對行人分類。訓練集有1016張正樣本,7650張負樣本,測試集分為基於分割窗體的分類(570張行人。7500張非行人)和整張圖片的檢測(250張包括行人的圖片,共587個行人)。CVC-02-System主要用於系統的性能評估,包括15個視頻序列(4364幀),7983個行人。
CVC-Virtual是通過Half-Life 2圖像引擎產生的虛擬行人數據集。共包括1678虛擬行人,2048個非行人圖片用於測試。
USC行人數據庫
該數據庫包括三組數據集(USC-A、USC-B和USC-C),以XML格式提供標注信息。
USC-A[Wu, 2005]的圖片來自於網絡。共205張圖片,313個站立的行人,行人間不存在相互遮擋,拍攝角度為正面或者背面;USC-B的圖片主要來自於CAVIAR視頻庫,包括各種視角的行人,行人之間有的相互遮擋,共54張圖片,271個行人。USC-C有100張圖片來自網絡的圖片。232個行人(多角度)。行人之間無相互遮擋。
三、Source Code
1.INRIA Object detection and Localization Toolkit, Dalal於2005年提出了基於HOG特征的行人檢測方法,行人檢測領域中的經典文章之中的一個。
HOG特征眼下也被用在其它的目標檢測與識別、圖像檢索和跟蹤等領域中。
2. Real-time Pedestrian Detection. Jianxin Wu實現的高速行人檢測方法。
3. Hough Transfom for Pedestrian Detection. Olga Barinova, CVPR 2010 Paper: On detection of multiple object instances using Hough Transforms
4. HIKSVM, HOG+LBP+HIKSVM, 行人檢測的經典方法.
5. GroundHOG, GPU-based Object Detection with Geometric Constraints, In: ICVS, 2011. CUDA版本號的HOG+SVM, video.
6. 100FPS_PDS, Pedestrian detection at 100 frames per second, R. Benenson. CVPR, 2012. 實時的(⊙o⊙)哦。 Real-time!!!
7. POM: Probabilistic Occupancy Map. Multiple camera pedestrian detection.
8. Pitor Dollar Detector. Integral Channel Feature + 多尺度特征近似+多特征融合. Real-Time!