RNN語言模型和序列生成 - 碼上歡樂

相關內容簡體繁體

RNN語言模型和序列生成

本文轉載自查看原文 2019-08-29 20:29 479

語言模型告訴你特定句子出現的概率是多少。
為了建立一個好的RNN模型，需要包括很大語料庫的訓練集。
將每個單詞都轉成one-hot向量，包括結尾標記和標點符號、未見單詞，作為輸入。
第一個時間步的輸入是零向量，做一個sorftmax，輸出字典里所有單詞的概率。以后每一步的輸入為一個單詞one-hot，輸出下一個單詞的概率。對所有輸出交叉熵求和，再反向傳播。
將輸出相乘得到整個句子的概率。
新序列采樣：根據第一個時間步輸出概率向量輸出，然后作為下一個時間步輸入。直到遇到EOS序列生成結束。基於字符的語言模型不善於捕捉句子前部分是如何影響后面的部分，而且訓練代價昂貴。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 基於LSTM語言模型的文本生成 1. 語言模型 pytorch --Rnn語言模型(LSTM，BiLSTM) -- 《Recurrent neural network based language model》語言模型的基本概念語言模型srilm基本用法語言模型發展綜述神經網絡語言模型NNLM 語言模型 Language Model (LM) 語言模型kenlm的訓練及使用語言模型：自回歸（Autoregressive LM）與自編碼（Autoencoder LM）

粵ICP備18138465號 © 2018-2026 CODEPRJ.COM