【深度学习篇】--Seq2Seq模型从初识到应用

本文转载自查看原文 2018-06-07 01:22 1055 深度学习和TensorFlow框架

一、前述

架构：

问题：

1、压缩会损失信息

2、长度会影响准确率

解决办法：

Attention机制：聚焦模式

“高分辨率”聚焦在图片的某个特定区域并以“低分辨率”，感知图像的周边区域的模式。通过大量实验证明，将attention机制应用在机器翻译，摘要生成，阅读理解等问题上，取得的成效显著。

比如翻译：“”知识”只是聚焦前两个字。

每个C取不同的概率和值：

Bucket机制：

正常情况要对所有句子进行补全，Bucket可以先分组，再计算。比如第一组计算输入[0-10]，输出[0-10]。

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 深度学习中的序列模型演变及学习笔记（含RNN/LSTM/GRU/Seq2Seq/Attention机制）李宏毅深度学习笔记-Seq2seq 深度学习的seq2seq模型——本质是LSTM，训练过程是使得所有样本的p(y1,...,yT‘|x1,...,xT)概率之和最大从Seq2seq到Attention模型到Self Attention pytorch seq2seq模型示例 seq2seq聊天模型（二）——Scheduled Sampling 学习笔记CB014:TensorFlow seq2seq模型步步进阶具有注意力机制的seq2seq模型 seq2seq模型以及其tensorflow的简化代码实现 seq2seq