原文:Swin Transformer論文閱讀筆記

Swin Transformer Swin transformer是一個用了移動窗口的層級式 Hierarchical transformer。其像卷積神經網絡一樣,也能做block以及層級式的特征提取。本篇博客結合網上的資料,對該論文進行學習。 摘要 本篇論文提出了一個新的Transformer,稱作Swin Transformer,其可以作為計算機視覺領域的一個通用的骨干網絡。這是因為ViT這 ...

2022-02-02 20:35 2 662 推薦指數:

查看詳情

Swin Transformer

論文鏈接:Swin Transformer: Hierarchical Vision Transformer using Shifted Windows Introduction 目前Transformer應用到圖像領域主要有兩大挑戰: 視覺實體變化大,在不同場景下視覺 ...

Fri Nov 19 07:29:00 CST 2021 0 1275
Swin Transformer的總結

  ViT打破了CV和NLP之間的壁壘,但是由於Transformer與CNN相比,少了一些歸納偏置,使得其在數據集較小的時候性能較差,另外由於其使用低分辨率特征映射且計算復雜度是圖像大小的二次方,其體系結構不適合用於密集視覺任務的通用主干網絡或輸入圖像分辨率較高時,Swin ...

Tue Dec 14 03:36:00 CST 2021 0 2639
PAN論文閱讀筆記

Efficient and Accurate Arbitrary-Shaped Text Detection with Pixel Aggregation Network PAN是一個任意形狀文字檢 ...

Thu Jul 16 01:28:00 CST 2020 0 792
SLAM論文閱讀筆記

[1]陳衛東, 張飛. 移動機器人的同步自定位與地圖創建研究進展[J]. 控制理論與應用, 2005, 22(3):455-460. [2]Cadena C, Carlone L, Carrillo ...

Fri Jun 30 22:02:00 CST 2017 0 2538
kalibr論文閱讀筆記

單目相機IMU標定 該論文將相機IMU標定分為兩個大方面: 一. 使用基函數來估計時間偏差 二. 相機和IMU的空間位置轉換 校准變量:重力、外參旋轉和平移、時鍾偏移、IMU位姿、加速度計偏置、陀螺儀偏置 ...

Thu Sep 20 17:55:00 CST 2018 0 1026
論文閱讀筆記(一)FCN

  本文先對FCN的會議論文進行了粗略的翻譯,使讀者能夠對論文的結構有個大概的了解(包括解決的問題是什么,提出了哪些方案,得到了什么結果)。然后,給出了幾篇博文的連接,對文中未鋪開解釋的或不易理解的內容作了詳盡的說明。最后給出了FCN代碼的詳解(待更新)。 Fully ...

Sun Apr 07 22:49:00 CST 2019 0 1043
GAN 論文閱讀筆記

目錄 GAN ACGAN AAE BiGAN BGAN BEGAN BicycleGAN ClusterGAN CGAN CCGAN C ...

Thu Jan 02 00:42:00 CST 2020 0 1131
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM