B站动手学深度学习第十八课：seq2seq（编码器和解码器）和注意力机制

本文转载自查看原文 2019-07-11 22:53 681 数据挖掘，机器学习/ Tensorflow，Keras/ 神经网络，图像识别

from mxnet import nd
h_forward = nd.array([1,2])
h_backward = nd.array([3,4])
h_bi = nd.concat(h_forward,h_backward,dim=0)
print(h_bi)

[1. 2. 3. 4.]
<NDArray 4 @cpu(0)>

不同时刻，C内h1,h2,h3所占的权重不同，权重是a。权重的求法用了softmax。e的求法和St-1和ht有关。

不同的注意力机制就是对a的设计不同。

原论文的e的取法如下图。

v，W是要学习的参数，有点像多层感知机。

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 动手学pytorch-注意力机制和Seq2Seq模型 seq2seq通俗理解----编码器和解码器(TensorFlow实现) 深度学习之注意力机制（Attention Mechanism）和Seq2Seq Seq2Seq模型与注意力机制具有注意力机制的seq2seq模型机器学习（ML）十二之编码解码器、束搜索与注意力机制 pytorch做seq2seq注意力模型的翻译 Pytorch系列教程-使用Seq2Seq网络和注意力机制进行机器翻译 NLP与深度学习（三）Seq2Seq模型与Attention机制深度学习之seq2seq模型以及Attention机制