循環神經（LSTM）網絡學習總結

本文轉載自查看原文 2018-04-18 19:09 2718 RNN/ 深度學習

摘要：

　　1.算法概述

　　2.算法要點與推導

　　3.算法特性及優缺點

　　4.注意事項

　　5.實現和具體例子

　　6.適用場合

內容：

　　1.算法概述

　　長短期記憶網絡（Long Short Term Memory networks) 通常叫做 “LSTM”,由Hochreiter & Schmidhuber (1997)提出，一個LSTM Cell圖示如下：

　　現在，我們先來定義一下用到的符號：

　　在網絡結構圖中，每條線都傳遞着一個向量。其中上面一條直線表示LSTM的狀態向量的傳遞；下面一條直線表示由LSTM的上一層輸出和這一層輸入組成的合並向量的傳遞；

　　粉紅色的圓圈表示逐點操作，這里涉及到1.兩個輸入向量各個元素相加；2.兩個輸入向量各個元素相乘，即矩陣的哈達瑪積(hadamard product)。

　　黃色的矩形框表示的是一個神經網絡層（就是很多個神經節點）；

　　合並的線表示把兩條線上所攜帶的向量進行合並 $h_{t - 1}$

　　分開的線表示將線上傳遞的向量復制一份，傳給兩個地方。

　　一個LSTM Cell是由3個門限結構和1個狀態向量傳輸線組成的，門限分別是遺忘門，傳入門，輸出門；

　　其中狀態向量傳輸線負責長程記憶，因為它只做了一些簡單的線性操作；3個門限負責短期記憶的選擇，因為門限設置可以對輸入向量做刪除或者添加操作;

$h_{t - 1}$

　1.2傳入門：

　　傳入門實現需要兩個步驟：首先，一個sigmoid 層決定哪些信息需要更新；一個 tanh 層生成一個備選的用來更新的內容；
　　再 $\tilde{C_{t}}$

$\tilde{C_{t}}$

　　1.3輸出門

　　輸出門實現需要兩個步驟:首先通過 $C_{t}$

接着,我們把狀態向量 $C_{t}$

$C_{t}$

　　1.4 LSTM cell狀態更新：

　　首先我們把舊的狀態和遺忘門的輸出相乘，把一些不想保留的信息忘掉；然后加上輸入門的輸出，這部分信息就是我們要添加的新內容。

　　2.算法要點與推導

　　　　符號說明：這里的“*”代表矩陣的哈達瑪積(hadamard product)

　　　　2.1LSTM前向傳播公式：

　　　　其中設計到參數Wf,Wi,Wc,Wo,bf,bi,bc,bo

　　　　2.2LSTM后向傳播公式：

　　 RNN推導

　　　　LSTM推導

　　　　（譯）理解 LSTM 網絡（Understanding LSTM Networks by colah）

　　3.算法特性及優缺點

　　　　優點：可以擬合序列數據，通過遺忘門和輸出門忘記部分信息來解決梯度消失的問題。

　　　　缺點：

　　4.注意事項

　　5.實現和具體例子

　　　　《TensorFlow實戰》實現LSTM處理PTB數據

　　　　《TensorFlow實戰》實現BiLSTM處理Mnist數據

　　　　tensorflow-char-rnn_model處理莎士比亞詩集

　　6.適用場合

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 機器學習之RNN循環神經網絡與LSTM 循環神經網絡與LSTM網絡機器學習（ML）九之GRU、LSTM、深度神經網絡、雙向循環神經網絡循環神經網絡之LSTM和GRU 循環神經網絡---LSTM模型深度學習四：從循環神經網絡入手學習LSTM及GRU 深度學習之循環神經網絡RNN概述，雙向LSTM實現字符識別 Pytorch學習筆記10----LSTM循環神經網絡原理 Pytorch循環神經網絡LSTM時間序列預測風速循環神經網絡lstm代碼實現（07-3）