原文:Swin Transformer论文阅读笔记

Swin Transformer Swin transformer是一个用了移动窗口的层级式 Hierarchical transformer。其像卷积神经网络一样,也能做block以及层级式的特征提取。本篇博客结合网上的资料,对该论文进行学习。 摘要 本篇论文提出了一个新的Transformer,称作Swin Transformer,其可以作为计算机视觉领域的一个通用的骨干网络。这是因为ViT这 ...

2022-02-02 20:35 2 662 推荐指数:

查看详情

Swin Transformer

论文链接:Swin Transformer: Hierarchical Vision Transformer using Shifted Windows Introduction 目前Transformer应用到图像领域主要有两大挑战: 视觉实体变化大,在不同场景下视觉 ...

Fri Nov 19 07:29:00 CST 2021 0 1275
Swin Transformer的总结

  ViT打破了CV和NLP之间的壁垒,但是由于Transformer与CNN相比,少了一些归纳偏置,使得其在数据集较小的时候性能较差,另外由于其使用低分辨率特征映射且计算复杂度是图像大小的二次方,其体系结构不适合用于密集视觉任务的通用主干网络或输入图像分辨率较高时,Swin ...

Tue Dec 14 03:36:00 CST 2021 0 2639
PAN论文阅读笔记

Efficient and Accurate Arbitrary-Shaped Text Detection with Pixel Aggregation Network PAN是一个任意形状文字检 ...

Thu Jul 16 01:28:00 CST 2020 0 792
SLAM论文阅读笔记

[1]陈卫东, 张飞. 移动机器人的同步自定位与地图创建研究进展[J]. 控制理论与应用, 2005, 22(3):455-460. [2]Cadena C, Carlone L, Carrillo ...

Fri Jun 30 22:02:00 CST 2017 0 2538
kalibr论文阅读笔记

单目相机IMU标定 该论文将相机IMU标定分为两个大方面: 一. 使用基函数来估计时间偏差 二. 相机和IMU的空间位置转换 校准变量:重力、外参旋转和平移、时钟偏移、IMU位姿、加速度计偏置、陀螺仪偏置 ...

Thu Sep 20 17:55:00 CST 2018 0 1026
论文阅读笔记(一)FCN

  本文先对FCN的会议论文进行了粗略的翻译,使读者能够对论文的结构有个大概的了解(包括解决的问题是什么,提出了哪些方案,得到了什么结果)。然后,给出了几篇博文的连接,对文中未铺开解释的或不易理解的内容作了详尽的说明。最后给出了FCN代码的详解(待更新)。 Fully ...

Sun Apr 07 22:49:00 CST 2019 0 1043
GAN 论文阅读笔记

目录 GAN ACGAN AAE BiGAN BGAN BEGAN BicycleGAN ClusterGAN CGAN CCGAN C ...

Thu Jan 02 00:42:00 CST 2020 0 1131
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM