相關內容簡體繁體

機器學習與Tensorflow（5）——循環神經網絡、長短時記憶網絡

本文轉載自查看原文 2019-01-06 13:29 941 機器學習與Tensorflow

1.循環神經網絡的標准模型

前饋神經網絡能夠用來建立數據之間的映射關系，但是不能用來分析過去信號的時間依賴關系，而且要求輸入樣本的長度固定
循環神經網絡是一種在前饋神經網絡中增加了分虧鏈接的神經網絡，能夠產生對過去數據的記憶狀態，所以可以用於對序列數據的處理，並建立不同時段數據之間的依賴關系
循環神經網絡是一類允許節點連接成有向環的人工神經網絡。如下圖：

2.循環神經網絡與遞歸神經網絡

從廣義上說，遞歸神經網絡可以分為結構遞歸神經網絡和時間遞歸神經網絡
從狹義上說，遞歸神經網絡可以通常就是指結構遞歸神經網絡，而時間遞歸神經網絡則被稱為循環神經網絡

3.標准循環神經網絡的結構類型（兩種）

不妨設t時刻，網絡的輸入向量為x(t),隱含向量為h(t),網絡的輸出向量是o(t),用V表示輸入層與隱含層之間的連接權值，U表示隱含層與隱含層之間的連接權值，W表示隱含層與輸出層之間的連接權值，b和a表示隱含層的輸出層的偏置

Elman網絡：

網絡結構如下圖：

Elman網絡包含從隱含節點到上下文節點的反饋鏈接，以及從上下文節點調到隱含節點的前饋鏈接，其中上下文節點的輸入是隱含層上一時刻的輸出
Elman網絡從0時刻到T時刻的計算過程可以描述為：

Jordan網絡：

網絡結構如下圖：

Jordan網絡包含從輸出節點到上下文節點的反饋，以及從上下文節點到隱含節點的前饋鏈接，其中上下文節點的輸入是輸出層上一時刻的輸出。此外，Jordan網絡的上下文節點允許自連接
Jordan網絡從0時刻到T時刻的計算過程可以描述為：

4.長短時記憶網絡（long short-term memory，LSTM）

長短時記憶網絡(LSTM network)，又稱為長短時記憶循環網絡，是一種在經典循環神經網絡的基礎上發展起來的改進模型。
LSTM網絡的特點在於利用記憶模塊代替普通的隱含節點，確保梯度在傳遞跨越很多時間步驟之后不消失或爆炸，從而能夠克服傳統循環神經網絡訓練中遇到的某些困難
長短時記憶網絡非常適合於從經驗中學習分類，以及處理和預測那些在重要事件之間存在未知時長延遲的時間序列
循環神經網絡和長短時記憶網絡之間的對應關系如下圖所示：

5.傳統記憶塊組成

傳統記憶塊有一個或者多個具有內部狀態的記憶細胞（memory sell）、一個輸入擠壓單元（input squashing unit）、一個輸入門控單元（input gating unit）、一個輸入門單元（input gate unit）、一個輸出門單元（output gate unit）、一個輸出擠壓單元（outnput squashing unit）、和一個輸出門控單元（output gating unit）幾部分組成。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 (轉)零基礎入門深度學習(6) - 長短時記憶網絡(LSTM) 序列模型（3）---LSTM（長短時記憶）機器學習與Tensorflow（2）——神經網絡及Tensorflow實現機器學習（ML）九之GRU、LSTM、深度神經網絡、雙向循環神經網絡 TensorFlow神經網絡機器學習使用詳細教程，此貼會更新！！！《機器學習》學習筆記（二）：神經網絡【機器學習基礎】神經網絡/深度學習基礎機器學習-淺談神經網絡和Keras的應用機器學習之神經網絡及python實現 TensorFlow學習筆記13-循環、遞歸神經網絡

粵ICP備18138465號 © 2018-2026 CODEPRJ.COM