emm,花了一周時間完成了DQN的從入門到入土,這個系列是完完全全的入門系列,因為講的內容很簡單,內容也比較少,僅僅是一個最基本的介紹。
我也是因為偶然的原因才接觸到強化學習,然后覺得很有意思,比較好奇它是怎么做到的,於是就花了一段時間去了解,接着就將自己的入門過程就寫下來了。
這個系列相比較與數據挖掘系列的博客,內容還是比較少的,內容如下所示:
- DQN(Deep Q-learning)入門教程(零)之教程介紹
- DQN(Deep Q-learning)入門教程(一)之強化學習介紹
- DQN(Deep Q-learning)入門教程(二)之最優選擇
- DQN(Deep Q-learning)入門教程(三)之蒙特卡羅法算法與Q-learning算法
- DQN(Deep Q-learning)入門教程(四)之Q-learning Play Flappy Bird
- DQN(Deep Q-learning)入門教程(五)之DQN介紹
- DQN(Deep Q-learning)入門教程(六)之DQN Play Flappy-bird ,MountainCar
說實話,以6篇博客想來學懂DQN(或者強化學習)是遠遠不夠的,一來,篇幅不夠;二來,自己的水平也不夠。我僅僅是個初學者,又怎么可能有能力將其講得廣闊而透徹呢?因此,這個系列也僅僅是一個入門系列,最基本的入門。
不過,如果我們對某一個東西有興趣的話,學習起來也就會事倍功半。它能夠站在后面驅使着我們去學習。在個人看來,機器學習本身就是一個好玩的東西(盡管掉了一堆頭發,是真的一堆頭發,我媽打掃房間的時候還吐槽我怎么掉了這么多頭發,/(ㄒoㄒ)/~~),如何進行加快模型的收斂,如何提取有用的信息,如何構建一個好的模型,這些都是值得研究,並且很有意思的東西。我還依稀的記得,當我了解到神經網絡總的MP模型的時候,我直接驚呆了,為模型之簡介感到驚嘆。
這個系列的博客實際上我是寫的匆匆忙忙,只花了約一周的時間就寫完了。實際上如果我時間很多的話,至少這個系列的博客不會低於15篇,但是,說實話我不敢這樣去寫。因為我需要考研了,如果寫15篇的話,那至少得需要近2個月的時間,這樣勢必會耽誤我的復習,因此也只能這樣了。如果我考研能夠成功上岸的話,那么我將會更加深入地去了解強化學習以及其優化方法,畢竟那時候時間應該會挺多的。總的來說,還是比較遺憾,無法將這個系列深入學習和寫下去。
接下來一段時間,如果沒有特殊情況,我基本不會再去寫博客,也不會對博客進行更新,如果大家想更加深入的去了解強學習,推薦大家可以去看看: