PredNet --- Deep Predictive coding networks for video prediction and unsupervised learning --- 論文筆記

本文轉載自查看原文 2017-03-12 19:50 1984 論文閱讀/ Predictive Learning

PredNet --- Deep Predictive coding networks for video prediction and unsupervised learning ICLR 2017

2017.03.12

Code and video examples can be found at: https://coxlab.github.io/prednet/

摘要：基於監督訓練的深度學習技術取得了非常大的成功，但是無監督問題仍然是一個未能解決的一大難題（從未標注的數據中學習到一個領域的結構）。本文探索了無監督學習中關於 video prediction 的問題。設計了一種 “PredNet”結構，實現了該項工程，並且得到了非常喜人的實驗結果。實驗結果表明：預測代表了一種非常強大的無監督學習框架，可以潛在的學習到物體或者場景結構。

網絡設計：

　　如上圖所示的流程，是有一系列的模塊堆疊在一起產生的。該網絡首先進行局部預測，然后減去真實的輸入，傳到下一層。

　　簡單的說，每個模塊可以分為 4 個部分：

　　1. 一個輸入卷積層 $A_l$

　　2. 循環表示層 $R_l$

　　3. 預測層 $\hat{A}_l $

　　4. 誤差表示層 $E_l$

　　 $R_l$ 是一個循環卷積網絡產生一個預測 A^l，layer的輸入是 Al。網絡計算 Al 和 A^l 的不同，然后輸出一個誤差表示 El, 分為單獨修正的 positive 和 negative error 傳遞。將該誤差 El 傳遞給卷積層，作為下一層的輸入 $A_{l+1}$。$R_l$ 模塊有兩個輸入，分別來自於：直接拷貝過來的 El，以及下一層 $R_{l+1}$ 的輸入。

　　這個網絡可以分為兩個最重要的部分來看，左邊 Rl 部分是循環產生式反卷積網絡；右邊 Al 和 El 是標准的深度卷積網絡。

　　該模型訓練的目標是：minimize the weighted sum of the firing rates of the error units. 此處的 error units 類似於 L1 error. 雖然此處沒有嘗試，但也可以嘗試其他的 loss function。

　　總的算法框架如下：

　　實驗部分：

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 [論文筆記] ：Temporal Graph Networks for Deep Learning on Dynamic Graphs 論文筆記：Model-Agnostic Meta-Learning for Fast Adaptation of Deep Networks 論文筆記系列-Speeding Up Automatic Hyperparameter Optimization of Deep Neural Networks by Extrapolation of Learning Curves 論文筆記：Deep Residual Learning Deep Learning 論文筆記 (3): Deep Learning Face Attributes in the Wild 『論文筆記』MoCo：Momentum Contrast for Unsupervised Visual Representation Learning 論文筆記之：Deep Reinforcement Learning with Double Q-learning 論文筆記——Channel Pruning for Accelerating Very Deep Neural Networks 【論文筆記】Learning Convolutional Neural Networks for Graphs