【文章推薦】ICCV2021 | 重新思考視覺transformers的空間維度

原文：ICCV2021 | 重新思考視覺transformers的空間維度

論文：Rethinking Spatial Dimensions of Vision Transformers 代碼：https: github.com naver ai pit 獲取：在CV技術指南后台回復點個關注，專注於計算機視覺的技術總結最新技術跟蹤經典論文解讀。前言：由於基於transformers的架構在計算機視覺建模方面具有創新性，因此對有效架構的設計約定的研究還較少。從C ...

2021-08-07 16:46 0 218 推薦指數：

查看詳情

ICCV2021 |重新思考人群中的計數和定位：一個純粹基於點的框架

論文：Rethinking Counting and Localization in Crowds:A Purely Point-Based Framework 代碼：https://gith ...

ICCV2021 | 用於視覺跟蹤的學習時空型transformer

前言本文介紹了一個端到端的用於視覺跟蹤的transformer模型，它能夠捕獲視頻序列中空間和時間信息的全局特征依賴關系。在五個具有挑戰性的短期和長期基准上實現了SOTA性能，具有實時性，比Siam R-CNN快6倍。本文來自公眾號CV技術指南的論文分享系列關注公眾號 ...

ICCV2021 | Swin Transformer: 使用移位窗口的分層視覺Transformer

前言本文解讀的論文是ICCV2021中的最佳論文，在短短幾個月內，google scholar上有388引用次數，github上有6.1k star。本文來自公眾號CV技術指南的論文分享系列關注公眾號CV技術指南，專注於計算機視覺的技術總結、最新技術跟蹤、經典論文解讀 ...

ICCV2021 | PnP-DETR：用Transformer進行高效的視覺分析

前言 DETR首創了使用transformer解決視覺任務的方法，它直接將圖像特征圖轉化為目標檢測結果。盡管很有效，但由於在某些區域(如背景)上進行冗余計算，輸入完整的feature maps的成本會很高。在這項工作中，論文將減少空間冗余的思想封裝到一個新的輪詢和池(Poll ...

ICCV2021 | 簡單有效的長尾視覺識別新方案：蒸餾自監督(SSD)

前言本文提出了一種概念上簡單但特別有效的長尾視覺識別的多階段訓練方案，稱為蒸餾自監督(Self Supervision to Distillation, SSD)。在三個長尾識別基准：ImageNet-LT、CIFAR100-LT和iNaturist 2018上取得了SOTA ...

ICCV2021 | MicroNet：以極低的 FLOPs 改進圖像識別

前言：這篇論文旨在以極低的計算成本解決性能大幅下降的問題。提出了微分解卷積，將卷積矩陣分解為低秩矩陣，將稀疏連接整合到卷積中。提出了一個新的動態激活函數-- Dynamic Shift Max，通過 ...

ICCV2021 | SOTR:使用transformer分割物體

CV技術指南的論文分享系列關注公眾號CV技術指南，專注於計算機視覺的技術總結、最新技術跟蹤、經典 ...

ICCV2021 | TOOD：任務對齊的單階段目標檢測

前言單階段目標檢測通常通過優化目標分類和定位兩個子任務來實現，使用具有兩個平行分支的頭部，這可能會導致兩個任務之間的預測出現一定程度的空間錯位。本文提出了一種任務對齊的一階段目標檢測(TOOD)，它以基於學習的方式顯式地對齊這兩個任務。 TOOD在MS-CoCO上實現了51.1Ap的單模 ...

原文：ICCV2021 | 重新思考視覺transformers的空間維度

相關推薦

相關標簽