標簽【q-learning】 - 碼上歡樂

【強化學習】python 實現 q-learning 例一

本文作者：hhh5460 本文地址：https://www.cnblogs.com/hhh5460/p/10134018.html 問題情境 -o---T# T 就是寶藏的位置, o 是探索者的位置這一次我們會用 q-learning 的方法實現一個小例子，例子的環境是一個一維世界，在世 ...

【強化學習】python 實現 q-learning 例二

本文作者：hhh5460 本文地址：https://www.cnblogs.com/hhh5460/p/10134855.html 問題情境一個2*2的迷宮，一個入口，一個出口，還有一個陷阱。 ...

【強化學習】python 實現 q-learning 例五（GUI）

本文作者：hhh5460 本文地址：https://www.cnblogs.com/hhh5460/p/10143579.html 感謝pengdali，本文的 class Maze 參考了他的博 ...

【強化學習】python 實現 q-learning 迷宮通用模板

本文作者：hhh5460 本文地址：https://www.cnblogs.com/hhh5460/p/10145797.html 0.說明這里提供了二維迷宮問題的一個比較通用的模板，拿到后 ...

【強化學習】python 實現 q-learning 例三（例一改寫）

本文作者：hhh5460 本文地址：https://www.cnblogs.com/hhh5460/p/10139738.html 例一的代碼是函數式編寫的，這里用面向對象的方式重新擼了一遍。好處 ...

【強化學習】python 實現 q-learning 例四（例二改寫）

將例二改寫成面向對象模式，並加了環境！不過更新環境的過程中，用到了清屏命令，play()的時候，會有點問題。learn()的時候可以勉強看到:P 0.效果圖 1.完整代碼相 ...

【強化學習】用pandas 與 numpy 分別實現 q-learning, saras, saras(lambda)算法

本文作者：hhh5460 本文地址：https://www.cnblogs.com/hhh5460/p/10159331.html 特別感謝：本文的三幅圖皆來自莫凡的教程 https://morv ...

相關標簽