論文地址:https://arxiv.org/abs/1611.01578
1. 論文思想
強化學習,用一個RNN學一個網絡參數的序列,然后將其轉換成網絡,然后訓練,得到一個反饋,這個反饋作用於RNN網絡,用於生成新的序列。
2. 整體架構
3. RNN網絡
4. 具體實現
因為每生成一個網絡,都會訓練一遍,Google用了800個GPU,訓練了12800個網絡,它采用的是分布式訓練的方法。
論文地址:https://arxiv.org/abs/1611.01578
強化學習,用一個RNN學一個網絡參數的序列,然后將其轉換成網絡,然后訓練,得到一個反饋,這個反饋作用於RNN網絡,用於生成新的序列。
因為每生成一個網絡,都會訓練一遍,Google用了800個GPU,訓練了12800個網絡,它采用的是分布式訓練的方法。
本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。