花費 5 ms
強化學習方法小結

花了一天時間大致了解了強化學習一些經典算法,總結成如下筆記。筆記中出現不少流程圖,不是我自己畫的都標了出處。 鋪墊 1. Bellman方程 在介紹強化學習算法之前先介紹一個比較重要的 ...

Tue Dec 24 01:37:00 CST 2019 0 2179

 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM