Simple Copy-Paste is a Strong Data Augmentation Method for Instance Segmentation CVPR2021
Abstarct
实例分割需要处理稀有类别对象,利用数据扩增来解决。本文简单随机粘贴对象,与半监督方法结合,通过伪标签来利用额外的数据。
many augmentation methods such as scale jittering and random resizing have beenwidely used,下图large scale jittering(strong)


large scale jittering + copy-paste示例,原图像两张。可以看到,CP(Copy-Paste)的关键思想是将不同object相互粘贴,增加样本数量,选择的方面有:源图像对(copy);目标图像(paste);对象粘贴的位置。prior work对上下文建模来决定粘贴的位置,本文随机挑选object和粘贴位置。
Related Work
数据增强 在本监督学习,自监督学习等上起作用。Augmentations(jittering) are more general purpose in nature and are mainly used for encoding invariances to data transformations, a principle well suited for image classification
Copy-Paste 类似于 mixup 和 CutMix,但只复制与对象对应的确切像素,而不是对象边界框中的所有像素。
实例分割 检测对象实例并分割与每个实例对应的像素。
长尾视觉识别 在训练深度网络时处理长尾数据的方法主要分为两:数据重采样和损失重新加权。其他更复杂的学习方法(例如元学习、因果推理 、贝叶斯方法等)也用于处理长尾数据。近期工作过分离特征学习和重新平衡阶段,指出了两阶段训练策略的有效性,因为使用重新平衡策略的端到端训练不利于特征学习。
Method
随机选择两张图片,每张图片随机尺度抖动和随机水平翻转。然后从一个图像中随机选择一对象子集粘贴到另一个图像上。最后调整GT:移除完全遮挡的对象并更新部分遮挡对象的掩码和边界框。
large scale jittering 整篇文章中使用两种不同类型的增强方法与复制粘贴相结合:标准尺度抖动 (SSJ) 和大规模抖动 (LSJ)。与大多数先前工作中的标准尺度抖动相比,大规模抖动产生了显着的性能改进。

Self-training Copy-Paste 除了在监督数据上研究 CopyPaste ,还尝试将其作为合并其他未标记图像的一种方式。自训练复制粘贴程序如下:(1)在标记数据上使用复制粘贴增强训练监督模型(2)在未标记数据上生成伪标签(3)将ground truth粘贴到伪标记和监督标记中图像并在此新数据上训练模型。
