标签【CV技术指南】

前言本文介绍了一个端到端的用于视觉跟踪的transformer模型，它能够捕获视频序列中空间和时间信息的全局特征依赖关系。在五个具有挑战性的短期和长期基准上实现了SOTA性能，具有实时性 ...

前言本文介绍了为什么初始化很重要，总结了常用的几种初始化方法：全零或等值初始化、正态初始化、均匀初始化、Xavier初始化、He初始化和Pre-trained初始化，并介绍了几个还活跃的初 ...

前言人脸表情识别(FER)在计算机视觉领域受到越来越多的关注。本文介绍了一篇在人脸表情识别方向上使用Transformer来学习关系感知的ICCV2021论文，论文提出了一个TransF ...

前言本文回顾了ViT的结构，总结了计算机视觉中的transformer的主要改进思路：改进分块，改进位置编码，改进Encoder，增加Decoder。每个思路下都介绍了相关的论文，介绍了 ...

CVPR2021 | 开放世界的目标检测

本文将介绍一篇很有意思的论文，该方向比较新，故本文保留了较多论文中的设计思路，背景知识等相关内容。前言：人类具有识别环境中未知对象实例的本能。当相应的知识最终可用时，对这些未知实例 ...

CVPR2021提出的一些新数据集汇总

前言在《论文创新的常见思路总结》(点击标题阅读)一文中，提到过一些新的数据集或者新方向比较容易出论文。因此纠结于选择课题方向的读者可以考虑以下几个新方向。文末附相关论文获取方式。 ...

前言本文介绍了一篇CVPR2021的语义分割论文，论文将语义分割视为序列到序列的预测任务，基于transformer作为编码器，介绍了三种解码器方式，选择其中效果最好的解码器方式与t ...

语义分割综述

前言本文对语义分割相关重要论文进行了简要概述，介绍了它们的主要改进方法和改进效果，并提供了这些论文的下载方式。本文来自公众号CV技术指南的技术总结系列欢迎关注CV技术指南，专注于 ...

前言本文解读的论文是ICCV2021中的最佳论文，在短短几个月内，google scholar上有388引用次数，github上有6.1k star。本文来自公众号CV技术指南 ...

使用Dice loss实现清晰的边界检测

前言：在深度学习和计算机视觉中，人们正在努力提取特征，为各种视觉任务输出有意义的表示。在一些任务中，我们只关注对象的几何形状，而不管颜色、纹理和照明等。这就是边界检测的作用所在。关注公众号 ...