[NLP]AR模型与AE模型

本文转载自查看原文 2020-03-01 22:59 841 NLP/ 深度学习

AR语言模型(AutoRegressive LM)：只能获取单向信息，即只能前向读取信息并预测t位置的单词或者从后向读取信息并预测t位置的单词，却不能同时获取双向信息，代表例子是GPT，GPT2，XLNet，ELMO

AR LM的优点：比较擅长生成类任务
缺点：只能获取单向信息，不能获取双向信息。

AE语言模型(AutoEncoder LM):获取双向信息进行预测，如想要预测位置t的单词，既可以前向获取信息也可以后向获取信息，代表例子是Bert

AE LM的优点：可以获取双向信息，能同时看到预测位置的上文和下文
缺点：如bert，它在预训练过程中会增加输入噪声，如对输入序列会随机mask掉一部分的单词，而在微调时却不会增加输入噪声，这种预训练-微调步骤中产生的差异，会产生一部分的人为误差

免责声明！

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 Redis自己的事件模型 ae 自回归模型（AR ）最强NLP模型-BERT NLP学习（3）---Bert模型 NLP模型之NNLM NLP之语言模型 [NLP]Transformer模型解析 [时间序列分析][4]--AR模型,MA模型,ARMA模型介绍 NLP学习（1）---Glove模型---词向量模型 NLP预训练模型＋模型蒸馏与压缩