GRU算法原理

本文轉載自查看原文 2021-03-17 00:08 474 NLP/ 機器學習

一、GRU算法

　　GRU（Gate Recurrent Unit，循環門單元）是循環神經網絡（Recurrent Neural Network, RNN）的一種。和LSTM（Long-Short Term Memory）一樣，也是為了解決長期記憶和反向傳播中的梯度等問題而提出來的。

　　在LSTM中引入了三個門函數：輸入門、遺忘門和輸出門來控制輸入值、記憶值和輸出值。而在GRU模型中只有兩個門：分別是更新門和重置門。具體結構如下圖所示：　　　　

　　圖中的z_t和r_t分別表示更新門和重置門。更新門用於控制前一時刻的狀態信息被帶入到當前狀態中的程度，更新門的值越大說明前一時刻的狀態信息帶入越多。重置門控制前一狀態有多少信息被寫入到當前的候選集

　　GRU組合了遺忘門和輸入門到一個單獨的更新門當中，也合並了細胞狀態 C和隱藏狀態h，並且還做了一些其他的改變，使得其模型比標准LSTM模型更簡單，其數學表達式為：

$\begin{equation} \begin{aligned} z_{t} &=\sigma\left(W_{z} \cdot\left[h_{t-1}, x_{t}\right]\right) \\ r_{t} &=\sigma\left(W_{r} \cdot\left[h_{t-1}, x_{t}\right]\right) \\ \tilde{h}_{t} &=\tanh \left(W \cdot\left[r_{t} \odot h_{t-1}, x_{t}\right]\right) \\ h_{t} &=\left(1-z_{t}\right) \odot h_{t-1}+z_{t} \odot \tilde{h}_{t} \end{aligned} \end{equation}\\$

　　其中，門控信號z_t的范圍為0~1。門控信號越接近1，代表”記憶“下來的數據越多；而越接近0則代表”遺忘“的越多。

二、總結

　　GRU輸入輸出的結構與普通的RNN相似，其中的內部思想與LSTM相似。

　　與LSTM相比，GRU內部少了一個”門控“，參數比LSTM少，但是卻也能夠達到與LSTM相當的功能。考慮到硬件的計算能力和時間成本，因而很多時候我們也就會選擇更加”實用“的GRU。

參考：

https://zhuanlan.zhihu.com/p/32481747

https://www.cnblogs.com/jiangxinyang/p/9376021.html

https://zhuanlan.zhihu.com/p/72500407

https://zhuanlan.zhihu.com/p/97027947

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 RNN & LSTM & GRU 的原理與區別 GRU(Gated Recurrent Unit) 原理講解 GRU（門控循環單元）原理+ 代碼實現 GRU網絡 AdaBoost 算法原理及推導限流的原理以及常用算法 GBDT算法原理服務限流原理及算法 XGBoost算法原理小結 Zookeeper選舉算法原理