https://zhuanlan.zhihu.com/p/392699791
前言
ICCV 2021 剛剛公布獲獎結果!先恭喜各位論文被收錄的同學。ICCV 2021 最終收錄1617篇論文,錄取率是25.9%。

Amusi 第一時間整理了 10多篇 ICCV 2021論文,這里對已公開github鏈接的論文進行盤點(有鏈接,不一定有代碼哈)。
ICCV 2021 合集鏈接如下,也歡迎大家提交issue,分享你的ICCV 2021論文或者開源工作。
ICCV 2021 代碼和開源項目目錄
- 視覺Transformer
- GAN
- 目標檢測
- 實例分割
- Few-shot Segmentation
- 超分辨率
- 行人重識別
- 異常檢測
- 其他
Visual Transformer
Pyramid Vision Transformer: A Versatile Backbone for Dense Prediction without Convolutions
- Paper(Oral): https://arxiv.org/abs/2102.12122
- Code: https://github.com/whai362/PVT
本文提出第一個用於不同像素級密集預測任務的視覺Transformer網絡!無需卷積!在圖像分類、目標檢測、實例/語義分割等任務上漲點明顯,參數更少,性能更強!

GAN
EigenGAN: Layer-Wise Eigen-Learning for GANs

目標檢測
DetCo: Unsupervised Contrastive Learning for Object Detection
表現SOTA!性能優於MoCov2、SwAV等網絡,其在分割、姿態估計等任務上也漲點明顯!

實例分割
Instances as Queries
基於查詢的端到端實例分割新網絡,表現SOTA!性能和速度均優於SOLO V2、CondInst和HTC等網絡,代碼已開源!

Crossover Learning for Fast Online Video Instance Segmentation
Few-shot Segmentation
Mining Latent Classes for Few-shot Segmentation
- Paper(Oral): https://arxiv.org/abs/2103.15402
- Code: https://github.com/LiheYoung/MiningFSS
超分辨率
Learning for Scale-Arbitrary Super-Resolution from Scale-Specific Networks
本文提出了一個用於SR網絡的插件模塊來實現任意尺度的SR,包括多尺度感知特征適應模塊和一個尺度感知上采樣層,還提出一種尺度感知知識遷移范式,代碼即將開源!

行人重識別
TransReID: Transformer-based Object Re-Identification
使用純Transformer進行ReID研究的工作(其中提出ViT-BoT強勁的baseline),TransReID在行人和車輛重識別任務上均表現SOTA!

異常檢測(Anomaly Detection)
Weakly-supervised Video Anomaly Detection with Robust Temporal Feature Magnitude Learning