RNN-1-參數共享、網絡的展開、常見應用

本文轉載自查看原文 2020-08-12 09:33 474 深度學習/ 自然語言處理

RNN簡介

循環神經網絡的主要用途是處理和預測序列數據。

RNN的網絡結構

1、循環神經網絡的經典結構

從網絡結構上，循環神經網絡會記憶之前的信息，並利用之前的信息影響后面節點的輸出。
參數共享思想：由於模塊A中的運算和變量在不同時刻是相同的，因此循環神經網絡理論上可以看作是同一神經網絡被無限復制的結果。循環神經網絡在不同的位置共享參數，從而使有限的參數處理任意長度的序列。

2、循環神經網絡按時間展開后的結構

將循環神經網絡對長度為N的序列展開后，可視為一個有着N個中間層的前饋神經網絡。對於一個序列數據，可以將這個序列上不同時刻的數據依次傳入循環神經網絡的輸入層，輸出時可以是對下一個時刻的預測，也可以是對當前時刻信息處理的結果。循環神經網絡要求每一個時刻都有一個輸入，但不一定每個時刻都需要有輸出。

3、循環神經網絡實現機器翻譯示意圖

機器翻譯的網絡結構可以分為兩部分：encoder和decoder。簡單描述一下機器翻譯的過程，假設機器翻譯的的句子是ABCD，那么循環神經網絡的第一個時刻的輸入分別是A、B、C、D，然后用第一個 _ 作為開始翻譯的提示符。在翻譯的過程中每一個時刻的輸入都是上一個時刻的輸出，當預測輸出為 _ 時翻譯結束，得到的XYZ就是ABCD的翻譯結果。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 [NL系列] RNN & LSTM 網絡結構及應用 RNN 權重共享 RNN 與 LSTM 的應用 RNN神經網絡 LSTM/RNN的應用Case pytorch之 RNN 參數解釋關於RNN (循環神經網絡）相鄰采樣為什么在每次迭代之前都需要將參數detach RNN 參數個數計算泰勒展開及其應用循環神經網絡（RNN）