本文作者:hhh5460 本文地址:https://www.cnblogs.com/hhh5460/p/10134018.html 問題情境 -o---T# T 就是寶藏的位置, o 是探索者的位置 這一次我們會用 q-learning 的方法實現一個小例子,例子的環境是一個一維世界,在世 ...
本文作者:hhh5460 本文地址:https://www.cnblogs.com/hhh5460/p/10134018.html 問題情境 -o---T# T 就是寶藏的位置, o 是探索者的位置 這一次我們會用 q-learning 的方法實現一個小例子,例子的環境是一個一維世界,在世 ...
本文作者:hhh5460 本文地址:https://www.cnblogs.com/hhh5460/p/10134855.html 問題情境 一個2*2的迷宮,一個入口,一個出口,還有一個陷阱。 ...
本文作者:hhh5460 本文地址:https://www.cnblogs.com/hhh5460/p/10143579.html 感謝pengdali,本文的 class Maze 參考了他的博 ...
本文作者:hhh5460 本文地址:https://www.cnblogs.com/hhh5460/p/10145797.html 0.說明 這里提供了二維迷宮問題的一個比較通用的模板,拿到后 ...
本文作者:hhh5460 本文地址:https://www.cnblogs.com/hhh5460/p/10139738.html 例一的代碼是函數式編寫的,這里用面向對象的方式重新擼了一遍。好處 ...
將例二改寫成面向對象模式,並加了環境! 不過更新環境的過程中,用到了清屏命令,play()的時候,會有點問題。learn()的時候可以勉強看到:P 0.效果圖 1.完整代碼 相 ...
本文作者:hhh5460 本文地址:https://www.cnblogs.com/hhh5460/p/10159331.html 特別感謝:本文的三幅圖皆來自莫凡的教程 https://morv ...