看图说话(Image Caption)任务是结合CV和NLP两个领域的一种比较综合的任务,Image Caption模型的输入是一幅图像,输出是对该幅图像进行描述的一段文字。这项任务要求模型可以识别图片中的物体、理解物体间的关系,并用一句自然语言表达出来。 应用 ...
Neural Storyteller Krios et al. : NST breaks down the task into two steps, which first generate unstylish captions than apply style shift techniques to generate stylish descriptions. SentiCap: Generat ...
2019-06-26 23:14 0 532 推荐指数:
看图说话(Image Caption)任务是结合CV和NLP两个领域的一种比较综合的任务,Image Caption模型的输入是一幅图像,输出是对该幅图像进行描述的一段文字。这项任务要求模型可以识别图片中的物体、理解物体间的关系,并用一句自然语言表达出来。 应用 ...
在上一篇博客中介绍的论文“Show and tell”所提出的NIC模型采用的是最“简单”的encoder-decoder框架,模型上没有什么新花样,使用CNN提取图像特征,将Softmax层之前的那一层vector作为encoder端的输出并送入decoder中,使用LSTM对其解码 ...
论文背景:Google Deepmind团队于2016发表在NIPS上的文章 motivation:提出新的image generation model based on pixelCNN[1]架构。可以为任意输入vector结合标签生成图片,在先验信息的前提下加入条件分布信息 模型关键 ...
说明: 这个合辑里面的论文不全是Image Caption, 但大多和Image Caption相关, 同时还有一些Workshop论文。 Guiding Long-Short Term Memory for Image Caption Generation (ICCV 2015 ...
出处 CVPR2017 Motivation 尝试用条件GAN网络来做image translation,让网络自己学习图片到图片的映射函数,而不需要人工定制特征。 Introduction 作者从不同种类的语言翻译类比,提出了Image translation的概念,并希望在给定足够 ...
论文地址:Deep Residual Learning for Image Recognition ResNet——MSRA何凯明团队的Residual Networks,在2015年ImageNet上大放异彩,在ImageNet的classification、detection ...
《Natural Image Stitching with the Global Similarity Prior》论文笔记(一) @(sinbad)[360sinbad@gmail.com] 简要记录下基于网格优化的图像对齐方法算法的流程步骤,以便日后记忆。 全局单应性VS网格优化 ...