RNN語言模型和序列生成


  1. 語言模型告訴你特定句子出現的概率是多少。
  2. 為了建立一個好的RNN模型,需要包括很大語料庫的訓練集。
  3. 將每個單詞都轉成one-hot向量,包括結尾標記和標點符號、未見單詞,作為輸入。
  4. 第一個時間步的輸入是零向量,做一個sorftmax,輸出字典里所有單詞的概率。以后每一步的輸入為一個單詞one-hot,輸出下一個單詞的概率。對所有輸出交叉熵求和,再反向傳播。
  5. 將輸出相乘得到整個句子的概率。
  6. 新序列采樣:根據第一個時間步輸出概率向量輸出,然后作為下一個時間步輸入。直到遇到EOS序列生成結束。基於字符的語言模型不善於捕捉句子前部分是如何影響后面的部分,而且訓練代價昂貴。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM