原文:强化学习读书笔记 - 08 - 规划式方法和学习式方法

强化学习读书笔记 规划式方法和学习式方法 学习笔记: Reinforcement Learning: An Introduction, Richard S. Sutton and Andrew G. Barto c , , 需要了解强化学习的数学符号,先看看这里: 强化学习读书笔记 术语和数学符号 什么是模型 model 环境的模型,本体可以通过模型来预测行为的反应。 对于随机的环境,有两种不同的 ...

2017-03-09 15:25 0 3411 推荐指数:

查看详情

强化学习读书笔记 - 04 - 动态规划

强化学习读书笔记 - 04 - 动态规划 学习笔记: Reinforcement Learning: An Introduction, Richard S. Sutton and Andrew G. Barto c 2014, 2015, 2016 数学符号看不懂的,先看看这里: 强化学习 ...

Fri Mar 03 08:28:00 CST 2017 0 4698
强化学习读书笔记 - 14 - 心理学

强化学习读书笔记 - 14 - 心理学 学习笔记: Reinforcement Learning: An Introduction, Richard S. Sutton and Andrew G. Barto c 2014, 2015, 2016 参照 Reinforcement ...

Wed Mar 29 03:03:00 CST 2017 0 1287
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM