常規目標檢測數據集有很多,現在前沿的目標檢測算法(如Faster R-CNN, Yolo, SSD, Mask R-CNN等)基本都是在這些常規數據集上實驗的,但是,基於常規數據集訓練的分類器,在航空遙感圖像上的檢測效果並不好,主要原因是航空遙感圖像有其特殊性:
1,尺度多樣性,航空遙感圖像從幾百米到近萬米的拍攝高度都有,且地面目標即使是同類目標也大小不一,如港口的輪船大的有300多米,小的也只有數十米;
2,視角特殊性,航空遙感圖像的視角基本都是高空俯視,但常規數據集大部分還是地面水平視角,所以同一目標的模式是不同的,在常規數據集上訓練的很好的檢測器,使用在航空遙感圖像上可能效果很差;
3,小目標問題,航空遙感圖像的目標很多都是小目標(幾十個甚至幾個像素),這就導致目標信息量不大,基於CNN的目標檢測方法在常規目標檢測數據集上一騎絕塵,但對於小目標,CNN的Pooling層會讓信息量進一步減少,一個24*24的目標經過4層pooling后只有約1個像素,使得維度過低難以區分出來;
4,多方向問題,航空遙感圖像采用俯視拍攝,目標的方向都是不確定的(而常規數據集上往往有一定的確定性,如行人、車輛基本都是立着的),目標檢測器需要對方向具有魯棒性;
5,背景復雜度高,航空遙感圖像視野比較大(通常有數平方公里的覆蓋范圍),視野中可能包含各種各樣的背景,會對目標檢測產生較強的干擾。
基於以上原因,對於航空遙感圖像目標檢測任務,常規數據集往往難以訓練出理想的目標檢測器,需要專門的航空遙感圖像數據庫。我整理了幾個:
1,DOTA:A Large-scale Dataset for Object Detection in Aerial Images,arXiv:1711.10398v1 [cs.CV] 28 Nov 2017。這是武大遙感國重實驗室夏桂松和華科電信學院白翔聯合做的一個數據集,2806張遙感圖像(大小約4000*4000),188,282個instances,分為15個類別。樣本類別及數目如下(與另一個開放數據集NWPU VHR-10對比):

2,UCAS-AOD: Dataset of Object Detection in Aerial Images,中國科學院大學模式識別與智能系統開發實驗室標注的,只包含兩類目標:汽車,飛機,以及背景負樣本。樣本數量如下:

DownLoad: Dataset 及其基本情況概述Instruction Instruction-cn
References:[1]H. Zhu, X. Chen, W. Dai, K. Fu, Q. Ye, J. Jiao, "Orientation Robust Object Detection in Aerial Images Using Deep Convolutional Neural Network," IEEE Int'l Conf. Image Processing, 2015.
3,NWPU VHR-10:西北工業大學標注的航天遙感目標檢測數據集,共有800張圖像,其中包含目標的650張,背景圖像150張,目標包括:飛機、艦船、油罐、棒球場、網球場、籃球場、田徑場、港口、橋梁、車輛10個類別。開放下載,大概73M.
4, RSOD-Dataset:武漢大學團隊標注,包含飛機、操場、立交橋、 油桶四類目標,數目分別為:
飛機:4993 aircrafts in 446 images. 操場: 191 playgrounds in 189 images. 立交橋: 180 overpass in 176 overpass.
油桶:1586 oiltanks in 165 images.
5, INRIA aerial image dataset: Inria是法國國家信息與自動化研究所簡稱,該機構擁有大量數據庫,其中此數據庫是一個城市建築物檢測的數據庫,標記只有building, not building兩種,且是像素級別,用於語義分割。訓練集和數據集采集自不同的城市遙感圖像。鏈接:
https://project.inria.fr/aerialimagelabeling/
為了方便大家下載,UCAS-AOD和NWPU VHR-10的下載鏈接還可以登錄我的個人百度雲盤:
https://pan.baidu.com/s/1bplTvif 密碼:ppef
reference: https://blog.csdn.net/hongxingabc/article/details/78833485
reference: https://blog.csdn.net/hongxingabc/article/details/78833485