原文:【CV论文阅读】Dynamic image networks for action recognition

论文的重点在于后面approximation部分。 在 Rank Pooling 的论文中提到,可以通过训练RankSVM获得参数向量d,来作为视频帧序列的representation。而在dynamic论文中发现,这样的参数向量d,事实上与image是同等大小的,也就是说,它本身是一张图片 假如map与image同大小而不是提取的特征向量 ,那么就可以把图片输入到CNN中进行计算了。如下图可以看 ...

2016-08-15 16:37 0 1452 推荐指数:

查看详情

CV论文阅读】Two stream convolutional Networks for action recognition in Vedios

论文的三个贡献 (1)提出了two-stream结构的CNN,由空间和时间两个维度的网络组成。 (2)使用多帧的密集光流场作为训练输入,可以提取动作的信息。 (3)利用了多任务训练的方法把两个数据集联合起来。 Two stream结构 视屏可以分成空间与时间两个部分,空间部分指独立 ...

Sun Aug 07 17:01:00 CST 2016 0 9206
CV论文阅读】Rank Pooling for Action Recognition

这是期刊论文的版本,不是会议论文的版本。看了论文之后,只能说,太TM聪明了。膜拜~~ 视频的表示方法有很多,一般是把它看作帧的序列。论文提出一种新的方法去表示视频,用ranking function的参数编码视频的帧序列。它使用一个排序函数(ranking function)主要 ...

Wed Aug 10 18:15:00 CST 2016 0 2928
CV论文阅读Image Captioning 总结

初次接触Captioning的问题,第一印象就是Andrej Karpathy好聪明。主要从他的两篇文章开始入门,《Deep Fragment Embeddings for Bidirectional Image Sentence Mapping》和《Deep Visual-Semantic ...

Sun Nov 20 07:51:00 CST 2016 7 8791
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM