花费 6 ms
[深度学习]实现一个博弈型的AI,从五子棋开始(2)

嗯,今天接着来搞五子棋,从五子棋开始给小伙伴们聊AI。 昨天晚上我们已经实现了一个五子棋的逻辑部分,其实讲道理,有个规则在,可以开始搞AI了,但是考虑到不够直观,我们还是顺带先把五子棋的UI也 ...

Wed Nov 15 06:43:00 CST 2017 13 15488
[深度学习]实现一个博弈型的AI,从五子棋开始(1)

好久没有写过博客了,多久,大概8年???最近重新把写作这事儿捡起来……最近在折腾AI,写个AI相关的给团队的小伙伴们看吧。 搞了这么多年的机器学习,从分类到聚类,从朴素贝叶斯到SVM,从神经网 ...

Tue Nov 14 07:41:00 CST 2017 14 10288
【资料总结】| Deep Reinforcement Learning 深度强化学习

  在机器学习中,我们经常会分类为有监督学习和无监督学习,但是尝尝会忽略一个重要的分支,强化学习。有监督学习和无监督学习非常好去区分,学习的目标,有无标签等都是区分标准。如果说监督学习的目标是预测 ...

Thu Jan 24 04:26:00 CST 2019 3 5457
强化学习 7——Deep Q-Learning(DQN)公式推导

上篇文章强化学习——状态价值函数逼近介绍了价值函数逼近(Value Function Approximation,VFA)的理论,本篇文章介绍大名鼎鼎的DQN算法。DQN算法是 DeepMind 团队 ...

Mon Sep 07 04:56:00 CST 2020 0 1999
在WIN上使用TORCS模拟器做深度强化学习(2)

当你在win上下载安装好TORCS和patch之后(如果不会请翻看之前的文章),你可以点击安装目录中的wtorcs.exe来启动客户端 TORCS总共有以下竞赛模式 其中practice ...

Wed Jun 17 20:20:00 CST 2020 0 816

 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM