原文:【CV论文阅读】Image Captioning 总结

初次接触Captioning的问题,第一印象就是Andrej Karpathy好聪明。主要从他的两篇文章开始入门, Deep Fragment Embeddings for Bidirectional Image Sentence Mapping 和 Deep Visual Semantic Alignments for Generating Image Descriptions 。基本上,第一篇 ...

2016-11-19 23:51 7 8791 推荐指数:

查看详情

CV论文阅读】Dynamic image networks for action recognition

论文的重点在于后面approximation部分。 在《Rank Pooling》的论文中提到,可以通过训练RankSVM获得参数向量d,来作为视频帧序列的representation。而在dynamic论文中发现,这样的参数向量d,事实上与image是同等大小的,也就是说,它本身是一张 ...

Tue Aug 16 00:37:00 CST 2016 0 1452
Image Captioning 经典论文合辑

Image Caption: Automatically describing the content of an image domain:CV+NLP Category:(by myself, you can read the survey for detail.) CNN+RNN ...

Sat Nov 03 01:50:00 CST 2018 0 2941
CV论文阅读】Going deeper with convolutions(GoogLeNet)

目的: 提升深度神经网络的性能。 一般方法带来的问题: 增加网络的深度与宽度。 带来两个问题: (1)参数增加,数据不足的情况容易导致过拟合 (2)计算资源要求高,而且在训练过程中会 ...

Tue Aug 02 04:17:00 CST 2016 0 3640
CV论文阅读】Rank Pooling for Action Recognition

这是期刊论文的版本,不是会议论文的版本。看了论文之后,只能说,太TM聪明了。膜拜~~ 视频的表示方法有很多,一般是把它看作帧的序列。论文提出一种新的方法去表示视频,用ranking function的参数编码视频的帧序列。它使用一个排序函数(ranking function)主要 ...

Wed Aug 10 18:15:00 CST 2016 0 2928
视频描述(Video Captioning)近年重要论文总结

视频描述 顾名思义视频描述是计算机对视频生成一段描述,如图所示,这张图片选取了一段视频的两帧,针对它的描述是"A man is doing stunts on his bike",这对在线的视频的检 ...

Tue Feb 25 22:57:00 CST 2020 0 1637
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM