原文:ICCV2021 | TOOD:任務對齊的單階段目標檢測

前言 單階段目標檢測通常通過優化目標分類和定位兩個子任務來實現,使用具有兩個平行分支的頭部,這可能會導致兩個任務之間的預測出現一定程度的空間錯位。本文提出了一種任務對齊的一階段目標檢測 TOOD ,它以基於學習的方式顯式地對齊這兩個任務。 TOOD在MS CoCO上實現了 . Ap的單模型單尺度測試。這大大超過了最近的單階段檢測器,如ATSS . AP GFL . AP 和PAA . AP ,它 ...

2021-12-07 19:53 0 897 推薦指數:

查看詳情

ICCV2021 | 用於視覺跟蹤的學習時空型transformer

​ 前言 本文介紹了一個端到端的用於視覺跟蹤的transformer模型,它能夠捕獲視頻序列中空間和時間信息的全局特征依賴關系。在五個具有挑戰性的短期和長期基准上實現了SOTA性能,具有實時性 ...

Sat Dec 11 05:11:00 CST 2021 0 319
ICCV2021 | MicroNet:以極低的 FLOPs 改進圖像識別

​前言:這篇論文旨在以極低的計算成本解決性能大幅下降的問題。提出了微分解卷積,將卷積矩陣分解為低秩矩陣,將稀疏連接整合到卷積中。提出了一個新的動態激活函數-- Dynamic Shift Max,通過 ...

Mon Sep 13 07:27:00 CST 2021 0 269
ICCV2021 | SOTR:使用transformer分割物體

​前言 本文介紹了現有實例分割方法的一些缺陷,以及transformer用於實例分割的困難,提出了一個基於transformer的高質量實例分割模型SOTR。 經實驗表明,SOTR不僅為實例分割 ...

Fri Nov 26 20:28:00 CST 2021 0 1009
ICCV2021 | Swin Transformer: 使用移位窗口的分層視覺Transformer

​ 前言 本文解讀的論文是ICCV2021中的最佳論文,在短短幾個月內,google scholar上有388引用次數,github上有6.1k star。 本文來自公眾號CV技術指南的論文分享系列 關注公眾號CV技術指南 ,專注於計算機視覺的技術總結、最新技術跟蹤、經典論文解讀 ...

Sun Nov 28 23:29:00 CST 2021 0 186
ICCV2021 | TransFER:使用Transformer學習關系感知的面部表情表征

​ 前言 人臉表情識別(FER)在計算機視覺領域受到越來越多的關注。本文介紹了一篇在人臉表情識別方向上使用Transformer來學習關系感知的ICCV2021論文,論文提出了一個TransFER模型,在幾個FER基准數據集上取得了SOTA性能。 本文來自公眾號CV技術指南的論文 ...

Fri Nov 19 04:16:00 CST 2021 0 306
ICCV2021 | PnP-DETR:用Transformer進行高效的視覺分析

​ 前言 DETR首創了使用transformer解決視覺任務的方法,它直接將圖像特征圖轉化為目標檢測結果。盡管很有效,但由於在某些區域(如背景)上進行冗余計算,輸入完整的feature maps的成本會很高。 在這項工作中,論文將減少空間冗余的思想封裝到一個新的輪詢和池(Poll ...

Tue Nov 23 23:12:00 CST 2021 0 156
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM