原文:使用PARL與Gym仿真環境進行深度Q學習(DQL)

blog翻譯。原blog:https: keon.github.io deep q learning 強化學習 強化學習是一種允許你創造能從環境中交互學習的AI agent 的機器學習算法。就跟我們學習騎自行車一樣,這種類型的AI通過試錯來學習。如上圖所示,大腦代表AI agent並在環境中活動。當每次行動過后,agent接收到環境反饋。反饋包括回報 reward 和環境的下個狀態 state 。 ...

2020-06-25 23:39 0 675 推薦指數:

查看詳情

強化學習仿真環境搭建入門Getting Started with OpenAI gym

gym入門 gym是用於開發和比較強化學習算法的工具包。它不對代理的結構做任何假設,並且與任何數字計算庫(例如TensorFlow或Theano)兼容。 gym庫是測試問題(環境)的集合,您可以用來制定強化學習算法。這些環境具有共享的接口,使您可以編寫常規算法。 安裝 首先,您需要安裝 ...

Wed Sep 09 00:05:00 CST 2020 0 984
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM