原文:Multimodal —— 看图说话(Image Caption)任务的论文笔记(二)引入attention机制

在上一篇博客中介绍的论文 Show and tell 所提出的NIC模型采用的是最 简单 的encoder decoder框架,模型上没有什么新花样,使用CNN提取图像特征,将Softmax层之前的那一层vector作为encoder端的输出并送入decoder中,使用LSTM对其解码并生成句子。模型非常直观,而且比常规的encoder decoder框架还要简单一点 图像特征只在开始时刻输入了 ...

2017-06-07 02:18 3 16886 推荐指数:

查看详情

Stylized Image Caption论文笔记

Neural Storyteller (Krios et al. 2015) : NST breaks down the task into two steps, which first gener ...

Thu Jun 27 07:14:00 CST 2019 0 532
[AI] 论文笔记 - CVPR2018: Generative Image Inpainting with Contextual Attention

注:博主是大四学生,翻译水平可能比不上研究人员的水平,博主会尽自己的力量为大家翻译这篇论文。翻译结果仅供参考,提供思路,翻译不足的地方博主会标注出来,请大家参照原文,请大家多多关照。 转载请务必注明出处,谢谢。 0. 译者序   题目翻译:基于内容感知生成模型的图像修复 ...

Fri Nov 23 02:25:00 CST 2018 3 8279
CNN+LSTM:看图说话

看图说话——CNN和LSTM的联合应用 https://blog.csdn.net/xinzhangyanxiang/article/details/79117869 看图说话是深度学习波及的领域 ...

Wed May 15 21:58:00 CST 2019 0 2461
看图说话--该圆角矩形代表含义

对于需求过程,范围是首要步骤。项目启动会议是为接下来的需求发现工作奠定基础,并确保项目成果需要的所有东西都已到位,主要利益相关者聚在一起对关键项目的问题达成一致意见。会议参与者有主要利益相关者:客户、 ...

Wed Mar 21 03:06:00 CST 2018 0 1505
论文笔记之:Graph Attention Networks

Graph Attention Networks 2018-02-06 16:52:49 Abstract:   本文提出一种新颖的 graph attention networks (GATs), 可以处理 graph 结构的数据,利用 masked ...

Fri Nov 24 18:22:00 CST 2017 1 2316
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM