原文:ICCV2021 | TOOD:任务对齐的单阶段目标检测

前言 单阶段目标检测通常通过优化目标分类和定位两个子任务来实现,使用具有两个平行分支的头部,这可能会导致两个任务之间的预测出现一定程度的空间错位。本文提出了一种任务对齐的一阶段目标检测 TOOD ,它以基于学习的方式显式地对齐这两个任务。 TOOD在MS CoCO上实现了 . Ap的单模型单尺度测试。这大大超过了最近的单阶段检测器,如ATSS . AP GFL . AP 和PAA . AP ,它 ...

2021-12-07 19:53 0 897 推荐指数:

查看详情

ICCV2021 | 用于视觉跟踪的学习时空型transformer

​ 前言 本文介绍了一个端到端的用于视觉跟踪的transformer模型,它能够捕获视频序列中空间和时间信息的全局特征依赖关系。在五个具有挑战性的短期和长期基准上实现了SOTA性能,具有实时性 ...

Sat Dec 11 05:11:00 CST 2021 0 319
ICCV2021 | MicroNet:以极低的 FLOPs 改进图像识别

​前言:这篇论文旨在以极低的计算成本解决性能大幅下降的问题。提出了微分解卷积,将卷积矩阵分解为低秩矩阵,将稀疏连接整合到卷积中。提出了一个新的动态激活函数-- Dynamic Shift Max,通过 ...

Mon Sep 13 07:27:00 CST 2021 0 269
ICCV2021 | SOTR:使用transformer分割物体

​前言 本文介绍了现有实例分割方法的一些缺陷,以及transformer用于实例分割的困难,提出了一个基于transformer的高质量实例分割模型SOTR。 经实验表明,SOTR不仅为实例分割 ...

Fri Nov 26 20:28:00 CST 2021 0 1009
ICCV2021 | Swin Transformer: 使用移位窗口的分层视觉Transformer

​ 前言 本文解读的论文是ICCV2021中的最佳论文,在短短几个月内,google scholar上有388引用次数,github上有6.1k star。 本文来自公众号CV技术指南的论文分享系列 关注公众号CV技术指南 ,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读 ...

Sun Nov 28 23:29:00 CST 2021 0 186
ICCV2021 | TransFER:使用Transformer学习关系感知的面部表情表征

​ 前言 人脸表情识别(FER)在计算机视觉领域受到越来越多的关注。本文介绍了一篇在人脸表情识别方向上使用Transformer来学习关系感知的ICCV2021论文,论文提出了一个TransFER模型,在几个FER基准数据集上取得了SOTA性能。 本文来自公众号CV技术指南的论文 ...

Fri Nov 19 04:16:00 CST 2021 0 306
ICCV2021 | PnP-DETR:用Transformer进行高效的视觉分析

​ 前言 DETR首创了使用transformer解决视觉任务的方法,它直接将图像特征图转化为目标检测结果。尽管很有效,但由于在某些区域(如背景)上进行冗余计算,输入完整的feature maps的成本会很高。 在这项工作中,论文将减少空间冗余的思想封装到一个新的轮询和池(Poll ...

Tue Nov 23 23:12:00 CST 2021 0 156
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM