作為一名快樂的肥宅,玩游戲是居家必備,無論是王者榮耀、吃雞、原神這些大熱游戲,還是跳一跳、合成大西瓜、2048、這些風靡一時得小游戲,咱都有涉及。但是為了成為一個“頭號玩家”,我總是瘋狂的去個各大社區、網站尋找各種攻略,跟着攻略成長,我時常在想,什么時候俺才能成為一代攻略大神啊,讓大家學習我的技術,豈不是很刺激!靈光一閃,畢竟我是個有點小技術的肥宅,曾經也痴迷過deepmind,跑過AlphaGo,這不得訓練一個AI玩一玩。
強化學習訓練2048游戲,觀察AI如何找到出口。

既然要練手,那就先從2048這種簡單,不考驗操作,純策略的游戲入手吧。在網上搜羅了一番,果然讓我找到了開源的2048游戲環境。
GitHub地址: https://github.com/rgal/gym-2048
下一步就是把這個算法和強化學習結合了。算法部分很簡單,目前我才用的是最傳統的DQN,10分鍾就可以達到一個還可以的模型效果。如果小伙伴們有想法,可以試試RainBow,PPO,A2C,SAC這類算法,相信會獲得更佳的效果。我開發這個模型,用的是來自華為雲的ModelArts(它是一個在線、開箱即用的AI平台,還有免費的GPU算力,每天不限次數使用,不要太爽!),所以代碼是在ipynb中跑的。
整體步驟大概可以分為3步:
1.創建游戲環境
2.創建DQN算法





3.創建網絡模型
此處我用的就是一個非常簡單的三層卷積網絡

完成以上三步,就可以愉快的開始訓練啦:

我只訓練了10分鍾,在這個不能錯步的嚴格環境下,推理時可以達到256分,如果采用更先進算法,更長的訓練時間,2048不是夢。
詳細代碼獲取方式:點此鏈接可直接在線運行,或者下載https://marketplace.huaweicloud.com/markets/aihub/notebook/detail/?id=3a11d09b-85f5-4ae4-b4a7-9b19be2b444d
這個技術來源是我在去年華為雲AI全棧成長計划中接觸到的,據說今年華為雲又開始了新一輪【AI實戰營】,6大分類實戰營Python、ModelArts、MindSpore AI框架、深度、強化、機器學習,助我們成為“AI王者”!短平快地學習全面AI知識的同時,還能拿到Mate 30Pro、智能手表、無線耳機等驚喜豪禮!我已經掃描下面二維碼報名啦~你還要等嗎?

