論文地址:https://arxiv.org/abs/1611.01578
1. 論文思想
強化學習,用一個RNN學一個網絡參數的序列,然后將其轉換成網絡,然后訓練,得到一個反饋,這個反饋作用於RNN網絡,用於生成新的序列。
2. 整體架構

3. RNN網絡

4. 具體實現
因為每生成一個網絡,都會訓練一遍,Google用了800個GPU,訓練了12800個網絡,它采用的是分布式訓練的方法。

5. 結論

論文地址:https://arxiv.org/abs/1611.01578
強化學習,用一個RNN學一個網絡參數的序列,然后將其轉換成網絡,然后訓練,得到一個反饋,這個反饋作用於RNN網絡,用於生成新的序列。


因為每生成一個網絡,都會訓練一遍,Google用了800個GPU,訓練了12800個網絡,它采用的是分布式訓練的方法。


本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。