原文:深度学习课程笔记(七):模仿学习(imitation learning)

深度学习课程笔记 七 :模仿学习 imitation learning . . 本文所涉及到的 模仿学习,则是从给定的展示中进行学习。机器在这个过程中,也和环境进行交互,但是,并没有显示的得到 reward。在某些任务上,也很难定义 reward。如:自动驾驶,撞死一人,reward为多少,撞到一辆车,reward 为多少,撞到小动物,reward 为多少,撞到 X,reward 又是多少,诸如此 ...

2017-12-10 11:04 4 16219 推荐指数:

查看详情

吴恩达深度学习课程笔记-3

01. 神经网络和深度学习 第四周 深层神经网络 4.1 & 4.2 深层神经网络 logistic回归模型可以看作一层网络,通过增加隐藏层的层数,就可以得到深层网络了。 4.3 检查矩阵的维数 确保神经网络计算正确的有效方法之一就是检查矩阵的维数,包括数据矩阵、参数 ...

Tue Jan 28 04:47:00 CST 2020 0 276
吴恩达深度学习课程笔记

神经网络和深度学习 课程 1-1深度学习概述 2-1 神经网络的编程基础 2-2 逻辑回归代价函数与梯度下降 2-3 计算图与逻辑回归中的梯度下降 2-4 向量化 2-5 向量化逻辑回归 2-6 向量化 logistic 回归的梯度输出 2-7 Python ...

Sun Aug 12 01:42:00 CST 2018 0 5574
吴恩达深度学习课程笔记

这几天每天花了点时间看完了吴恩达的深度学习课程视频。目前还只有前三个课程,后面的卷积神经网络和序列模型尚未开课。课程的视频基本上都是十分钟出头的长度,非常适合碎片时间学习。 一直以为机器学习的重点在于设计精巧、神秘的算法来模拟人类解决问题。学了这门课程才明白如何根据实际问题优化、调整模型更为重要 ...

Fri Oct 27 17:24:00 CST 2017 10 4012
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM