與自然圖像相比航空遙感圖像特殊性:
1,尺度多樣性,航空遙感圖像從幾百米到近萬米的拍攝高度都有,且地面目標即使是同類目標也大小不一,如港口的輪船大的有300多米,小的也只有數十米;
2,視角特殊性,航空遙感圖像的視角基本都是高空俯視,但常規數據集大部分還是地面水平視角,所以同一目標的模式是不同的,在常規數據集上訓練的很好的檢測器,使用在航空遙感圖像上可能效果很差;
3,小目標問題,航空遙感圖像的目標很多都是小目標(幾十個甚至幾個像素),這就導致目標信息量不大,基於CNN的目標檢測方法在常規目標檢測數據集上一騎絕塵,但對於小目標,CNN的Pooling層會讓信息量進一步減少,一個24*24的目標經過4層pooling后只有約1個像素,使得維度過低難以區分出來;
4,多方向問題,航空遙感圖像采用俯視拍攝,目標的方向都是不確定的(而常規數據集上往往有一定的確定性,如行人、車輛基本都是立着的),目標檢測器需要對方向具有魯棒性;
5,背景復雜度高,航空遙感圖像視野比較大(通常有數平方公里的覆蓋范圍),視野中可能包含各種各樣的背景,會對目標檢測產生較強的干擾。

①DOTA:A Large-scale Dataset for Object Detection in Aerial Images。這是武大遙感國重實驗室夏桂松和華科電信學院白翔聯合做的一個數據集,2806張遙感圖像(大小約4000*4000),188,282個instances,分為15個類別。樣本類別及數目如下(與另一個開放數據集NWPU VHR-10對比)。
②UCAS-AOD:Dataset of Object Detection in Aerial Images,國科大模式識別實驗室標注的,只包含兩類目標:汽車,飛機,以及背景負樣本。
NWPU VHR-10:西北工業大學標注的航天遙感目標檢測數據集,共有800張圖像,其中包含目標的650張,背景圖像150張,目標包括:飛機、艦船、油罐、棒球場、網球場、籃球場、田徑場、港口、橋梁、車輛10個類別。開放下載,大概73M。
③RSOD-Dataset:武漢大學團隊標注,包含飛機、操場、立交橋、 油桶四類目標,數目分別為:
飛機:4993 aircrafts in 446 images.
操場: 191 playgrounds in 189 images.
立交橋: 180 overpass in 176 overpass.
油桶:1586 oiltanks in 165 images.
④.INRIA aerial image dataset:Inria是法國國家信息與自動化研究所簡稱,該機構擁有大量數據庫,其中此數據庫是一個城市建築物檢測的數據庫,標記只有building, not building兩種,且是像素級別,用於語義分割。訓練集和數據集采集自不同的城市遙感圖像。
⑤TGRS-HRRSD-Dataset:HRRSD是中國科學院西安光學精密機械研究所光學影像分析與學習中心制作用於研究高分辨率遙感圖像目標檢測的數據集。
⑥DIOR:西工大韓軍偉課題組提出了一種用於光學遙感圖像中目標檢測的大規模基准數據集“DIOR”,由23463幅圖像和190288個目標實例組成,並對近年來基於深度學習的目標檢測方法進行了綜述。
⑦xView:美國國防部的國防創新部門實驗室(DIUx)、DigitalGlobe還有美國國家地理空間情報局的研究人員發布了xView。這是一個數據集和其相關的競賽,用於評估人工智能方法對高空衛星圖像進行分類的能力。 xView包含60個類別的100萬個不同對象,分布在1,400平方公里的衛星圖像上,最大地面樣本分辨率為0.3米。該數據集旨在測試圖像識別的各個領域,包括:學習效率,細粒度類別檢測和多尺度識別等。
數據集百度雲:
鏈接:https://pan.baidu.com/s/1tOnUvTK7VQNjtae8uYRMsA
提取碼:kyjs
