原文:Deep Feature Flow for Video Recognition

来自MSRA视觉计算组,发表在CVPR 上。这篇文章提出了一个结合光流的快速视频目标检测和视频语义分割方法。 motivation 在视频流的每一帧上用CNN计算特征太慢了。 两个相邻帧有相似的feature map 结合光流将特征进行传播 在目标检测和语义分割任务中,通用的做法是首先将图片送到一个深层卷积网络提取特征,再将特征送入相应的任务网络得到结果。在视频上进行目标检测或者语义分割任务时, ...

2019-03-24 15:12 0 1065 推荐指数:

查看详情

Collaborative Spatioitemporal Feature Learning for Video Action Recognition

Collaborative Spatioitemporal Feature Learning for Video Action Recognition 摘要 时空特征提取在视频动作识别中是一个非常重要的部分。现有的神经网络模型要么是分别学习时间和空间特征(C2D),要么是不加控制地联合学习时间 ...

Wed Aug 07 17:11:00 CST 2019 0 736
Flow-Guided Feature Aggregation for Video Object Detection论文笔记

摘要 目前检测的准确率受物体视频中变化的影响,如运动模糊,镜头失焦等。现有工作是想要在框的级别上寻找时序信息,但这样的方法通常不能端到端训练。我们提出了flow-guided feature aggregation,一个用于视频物体检测的端到端学习框架。在特征级别上利用时序信息,通过相邻帧的运动 ...

Thu Aug 24 05:08:00 CST 2017 1 2499
SlowFast Networks for Video Recognition

▌Kinetics 数据集的动作分类 对于视频动作分类,作者采用 Kinetics-400 数据集,其中包含 ...

Thu Dec 27 00:50:00 CST 2018 0 1454
表情识别-Deep Facial Expression Recognition: A Survey

论文阅读:《Deep Facial Expression Recognition: A Survey》 总述:这篇论文对表情识别的相关信息进行了全面的总结,其中包括对FER相关的数据集介绍、对基于深度神经网络的静态图片和动态图片序列(视频)FER相关算法的优缺点总计,以及对FER面临的机遇和挑战 ...

Tue Mar 03 21:35:00 CST 2020 0 3929
Deep Audio-Visual Speech Recognition

Deep Audio-Visual Speech Recognition 作者:Triantafyllos Afouras, Joon Son Chung, Andrew Senior, Oriol Vinyals, Andrew Zisserman 原文链接 0 摘要   这项工作的目的 ...

Thu Apr 30 23:57:00 CST 2020 0 686
Multi-Fiber Networks for Video Recognition (MFNet)

Motivation:减少时空网络的计算量,保持视频分类精度的基础上,使速度尽可能接近对应网络的2D版本。 为此提出 Multi-Fiber 网络,将复杂网络拆分成轻量网络的集成,利用 fibe ...

Tue Oct 16 06:58:00 CST 2018 0 1716
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM