标签【0065.强化学习框架RLlib介绍】

目录　　什么是Ray 　　什么是RLlib 　　简单的代码风格　　Policies 　　Sample Batches 　　Training 　　Application Support ...

目录　　开场（Getting Started）　　评估训练策略（Evaluating Trained Policies）　　指定参数（Specifying Parameters）　　指 ...

目录　　基础pythonAPI概览　　计算动作（Computing Actions）　　获取策略状态（Accessing Policy State）　　获取模型状态（Accessing ...

目录　　定制训练流程（Custom Training Workflows）　　全局协调（Global Coordination）　　回调函数和自定义准则（Callbacks and Cus ...