第七讲_图像描述(图说)Image Captioning


第七讲_图像描述(图说)Image Captioning

  • 本章结构

  • 递归神经网络

  • 时序后向传播(BPTT)

朴素Vanilla-RNN

  • 基本模型
  • 用sigmoid存在严重的梯度消失

LSTM长短时记忆模型(97年提出)

  • 基本模型

  • 模型对比

  • LSTM数学模型

  • 控制门作用理解

  • LSTM结构图






  • LSTM变种:

  • Peephole

  • Coupled 忘记输入门

GRU门限递归单元(Gated Recurrent Unit)

  • 改进
  • LSTM和GRU比较

图像描述

  • 为图片生成描述语言

  • 具有多模态理解和推理;复合理解与推理等研究难点和挑战

  • 传统的分段处理策略

  • 新的点对点策略

  • 模型组成

Show and tell 模型

  • 概述

  • 具有attention机制模型

数据集

  • MSCOCO标注集


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM