从前有一家IT公司,里面有很多人,每个人都有自己的年龄、身高、性别,等等。这些人在这家IT公司里从事着不同的职业,有负责接待的前台,有负责销售的业务员,有负责招聘的HR,有负责扫地的清洁工,还有很多很 ...
梯度是微积分多元函数的一个重要概念,简单来说,梯度是一个向量,当函数上的一点按照该向量移动,函数值增加最大,该向量由函数分别对自变量的偏导值所构成。如果函数是二元函数,则梯度是二维向量,在自变量构成的平面上,如果函数是三元函数,则梯度是三维向量,在自变量构成的空间中。本文着重对它的上述的意义,进行形象的阐述。 下面分别举个例子: u x,y x y ,在 , 这一点,梯度向量为 , 。 其图像如下 ...
2020-02-09 15:29 0 730 推荐指数:
从前有一家IT公司,里面有很多人,每个人都有自己的年龄、身高、性别,等等。这些人在这家IT公司里从事着不同的职业,有负责接待的前台,有负责销售的业务员,有负责招聘的HR,有负责扫地的清洁工,还有很多很 ...
这位外国博主的个人空间:3Blue1Brown 视频地址:线性代数的本质 - 系列合集 (若上述url失效,请点击上方该博主个人空间,搜索“线性代数的本质”视频) 矩阵乘法与线性变换复合(视频 ...
策略梯度(Policy gradient)是所有基于策略搜索的强化学习算法的基础,就像MDP是所有强化学习问题的基础一样。 后续提出的算法(如Actor-Critic、TRPO、PPO、DPG)都是针对策略梯度算法的缺陷提出改进,所以理解策略梯度的各种细节十分必要。 为什么要用基于策略的学习 ...
备注:阅读本博客之前,需要具备一点面向对象编程的知识(很少的一部分,别慌) 关于进程的一点理解 在任何时刻需要记住一点:任何某一时刻CPU只能执行一条指令,为 一个进程服务,而不是多个进程服务。 什么是多进程? 比如你可以一边听网易音乐,一边聊天;这是两个不同的进程,这就是多进程 ...
...
梯度:梯度的本意是一个向量(矢量),表示某一函数在该点处的方向导数沿着该方向取得最大值, 即函数在该点处沿着该方向(此梯度的方向)变化最快,变化率最大(为该梯度的模)。 百度百科详细含义:https://baike.baidu.com/item/%E6%A2%AF%E5%BA%A6 ...
共轭梯度法关键是要找正交向量寻找方向,去不断逼近解。 其本质是最小二乘解的思想 最小二乘解 其中A系数矩阵是确定的,Ax是永远都取不到向量 b的,取得到那就是不用最小二乘解 我要求AX和b最小的距离,就是要求b在Ax上的投影,向量b-AX一定是要垂直于AX ...