[NLP]AR模型與AE模型

本文轉載自查看原文 2020-03-01 22:59 841 NLP/ 深度學習

AR語言模型(AutoRegressive LM)：只能獲取單向信息，即只能前向讀取信息並預測t位置的單詞或者從后向讀取信息並預測t位置的單詞，卻不能同時獲取雙向信息，代表例子是GPT，GPT2，XLNet，ELMO

AR LM的優點：比較擅長生成類任務
缺點：只能獲取單向信息，不能獲取雙向信息。

AE語言模型(AutoEncoder LM):獲取雙向信息進行預測，如想要預測位置t的單詞，既可以前向獲取信息也可以后向獲取信息，代表例子是Bert

AE LM的優點：可以獲取雙向信息，能同時看到預測位置的上文和下文
缺點：如bert，它在預訓練過程中會增加輸入噪聲，如對輸入序列會隨機mask掉一部分的單詞，而在微調時卻不會增加輸入噪聲，這種預訓練-微調步驟中產生的差異，會產生一部分的人為誤差

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 NLP之語言模型 [NLP]Transformer模型解析 NLP與深度學習（四）Transformer模型 [NLP]分詞模型、創建詞庫 NLP系列4：NER模型介紹 NLP（三）_統計語言模型 python 時間序列滾動預測的ar模型 NLP預訓練模型＋模型蒸餾與壓縮 NLP學習（2）----文本分類模型【NLP學習其二】什么是隱馬爾可夫模型HMM?