【文章推荐】李宏毅深度学习笔记-Seq2seq

原文：李宏毅深度学习笔记-Seq2seq

在讲Sequence Generation之前，再复习下RNN和有门的RNN LSTM，GRU 之前告诉你说，RNN是一个有记忆的神经网络，但今天从另外一个角度来讲RNN。我们说RNN特别的地方是它里面有一个basic函数，用 f 来表示，在RNN里面会被反复使用。这个basic函数的input是两个向量 h,x ，output是另外两个向量，写作 h ,y ，我们知道说要使用RNN时，你的输入 ...

2020-11-06 20:49 0 523 推荐指数：

查看详情

李宏毅深度学习笔记-为什么要深度？

问题：越深越好？层数越多，参数越多，model比较复杂，数据又多的话，本来误差就越小，这为什么归因于”深“呢？矮胖结构 v.s. 高瘦结构真正要比较”深“和”浅“的model的时候 ...

李宏毅深度学习笔记-Transformer

Transformer英文的意思就是变形金刚，Transformer现在有一个非常知名的应用，这个应用叫做BERT，BERT就是非监督的Transformer，Transformer是一个seq2seq model with “self-attention"。Transformer在seq2seq ...

李宏毅深度学习笔记-深度学习简介

李宏毅深度学习笔记 https://datawhalechina.github.io/leeml-notes 李宏毅深度学习视频 https://www.bilibili.com/video/BV1JE411g7XF step1 神经网络激活函数是sigmoid，红色圈是一组神经元，每个 ...

NLP与深度学习（三）Seq2Seq模型与Attention机制

1. Attention与Transformer模型 Attention机制与Transformer模型，以及基于Transformer模型的预训练模型BERT的出现，对NLP领域产生了变革性提 ...

李宏毅《机器学习深度学习》简要笔记（一）

P1 一、线性回归中的模型选择上图所示：　　五个模型，一个比一个复杂，其中所包含的function就越多，这样就有更大几率找到一个合适的参数集来更好的拟合训练集。所以，随着模型的复杂度提 ...

李宏毅深度学习笔记-半监督学习

半监督学习什么是半监督学习？大家知道在监督学习里，有一大堆的训练数据（由input和output对组成）。例如上图所示\(x^r\)是一张图片，\(y^r\)是类别的label。半监督学习是说，在label数据上面，有另外一组unlabeled的数据，写成\(x^u ...

深度学习之seq2seq模型以及Attention机制

RNN，LSTM，seq2seq等模型广泛用于自然语言处理以及回归预测，本期详解seq2seq模型以及attention机制的原理以及在回归预测方向的运用。 1. seq2seq模型介绍　　seq2seq模型是以编码（Encode）和解码（Decode）为代表的架构方式，seq2seq模型 ...

李宏毅深度学习笔记-反向传播

李宏毅深度学习笔记 https://datawhalechina.github.io/leeml-notes 李宏毅深度学习视频 https://www.bilibili.com/video/BV1JE411g7XF 背景梯度下降假设有很多参数\(\theta\) 选择一组初始值 ...

原文：李宏毅深度学习笔记-Seq2seq

相关推荐

相关标签