強化學習實戰:表格型Q-Learning玩井字棋(四)游戲時間


強化學習實戰 | 表格型Q-Learning玩井字棋(三)優化,優化 中,我們經過優化和訓練,得到了一個還不錯的Q表格,這一節我們將用pygame實現一個有人機對戰,機機對戰和作弊功能的井字棋游戲。至於勝率統計這個功能,其實沒有必要了——因為Q表格AI內戰永遠是平局。基本的pygame用法可以學習 Create a game with Pygame and Design Patterns 中的部分章節。總得來說就是逐幀繪制,循環刷新。

項目地址:碼雲

機機對戰

Q表格 vs Q表格

點開 CHEAT 可以查看藍方在決策時使用的Q表格: 

 Q表格 vs 隨機

 人機對戰

 

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM