論文筆記——NEURAL ARCHITECTURE SEARCH WITH REINFORCEMENT LEARNING


論文地址:https://arxiv.org/abs/1611.01578

1. 論文思想

強化學習,用一個RNN學一個網絡參數的序列,然后將其轉換成網絡,然后訓練,得到一個反饋,這個反饋作用於RNN網絡,用於生成新的序列。

2. 整體架構

3. RNN網絡

4. 具體實現

因為每生成一個網絡,都會訓練一遍,Google用了800個GPU,訓練了12800個網絡,它采用的是分布式訓練的方法。

5. 結論


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM