DOTA数据集 - 码上欢乐

相关内容简体繁体

DOTA数据集

本文转载自查看原文 2021-12-03 16:36 148 目标检测

航拍图像面临的问题

正常图像受重力作用相对固定，航拍图像的物体受拍摄角度影响
航拍图像的物体比例变化很大
某些航拍图像中小物体很密集
传统的数据集面临数据偏差的问题严重

好的数据集必备的几个特征

大量图像数据
单个类别有足够多的实例
正确定向对象说明
单张图片中有足够多种类的物体，以便接近于真实世界

DOTA数据集特征

15种类别：飞机、轮船、储槽、网球场、篮球场、棒球场、田径场、港口、桥、大的交通工具、小的交通工具、直升机、环岛、足球场、游泳池。其中14个主类，（交通工具算一个主类）

paper中的描述：plane, ship, storage tank, baseball diamond, tennis court, basketball court, ground track field, harbor, bridge, large vehicle, small vehicle, helicopter, roundabout, soccer ball field and basketball court.
传统的bbox检测方式通过四元组$ (x_c, y_c, w, h)$来表示，即一个没有角度的bounding box来识别object

两种思路：

\((x_c, y_c, w, h, \theta)\),只能用来标记正方形的bbox，不能将大物体紧密的包围在bbox中
四个点的不规则四边形。选定初始点为第一个点，然后按照顺时针方向依次标注四个点。初始点的选择规则：物体头部或者左上角点

数据集划分：1/6的验证集、1/3的测试集和1/2的训练集，其中测试集不会公布。
图片尺寸从800X800到4000X4000不等，传统的数据集少有超过1000X1000的。
图像中的实例很多，纵横比不一。传统用于COCO检测的模型不适用（类似密集检测）。图像中相同类别的物体的大小比例不一致（基于航拍的距离变化），对模型提出了更多的挑战。细粒度的模型表现会更好，因为模型会更加关注物体的特征而不是通过大小来判别物体。
数据集中基于航拍距离的图片比例如下：

评估原型

图片太大，训练时对其进行切分。但很可能将一个完整的物体切分成几部分。对于\(U_i = \frac{a_i}{A_0} < 0.7\)的物体（可以理解为如果在切分后的图片中，这个物体只有原来的70%以下的部分了），就认为识别它是一个比较难的任务
两种任务：HBB（Horizontal bounding box） and OBB(oriented bounding box)。OBB对模型造成了很大的困难。
各种模型在DOTA数据集上的表现，左为HBB，右为OBB

结果分析

交通工具类和轮船类的分析结果不好，主要原因在于这类物体太小、太密集。
对比HBB和OBB的结果，HBB的定位精确度要比OBB差很多，证明了OBB是更加适合实际应用的方式。
具有较大纵横比的物体对于OBB方式的模型来说更加难回归。
交叉数据集验证证明了模型在DOTA数据集上的表现普遍很差，DOTA数据集的挑战性更加强。

免责声明！

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 DOTA数据集数据集 SLAM数据集电影数据集 bankdata数据集 Iris数据集 SAS数据集 WiderFace数据集 iris数据集 Drebin数据集

粤ICP备18138465号 © 2018-2025 CODEPRJ.COM