原文:(转)机器学习之——自动求导

随机梯度下降法 SGD 是训练深度学习模型最常用的优化方法。在前期文章中我们讲了梯度是如何计算的,主要采用BP算法,或者说利用链式法则。但是深度学习模型是复杂多样的,你不大可能每次都要自己使用链式法则去计算梯度,然后采用硬编程的方式实现。 而目前的深度学习框架其都是实现了自动求梯度的功能,你只关注模型架构的设计,而不必关注模型背后的梯度是如何计算的。不过,我们还是想说一说自动求导是如何实现的。 这 ...

2019-10-27 10:48 0 906 推荐指数:

查看详情

机器学习中的线性代数之矩阵求导

今天推导公式,发现居然有对矩阵的求导,狂汗--完全不会。不过还好网上有人总结了。吼吼,赶紧搬过来收藏备份。 基本公式:Y = A * X --> DY/DX = A'Y = X * A --> DY/DX = AY = A' * X * B --> DY/DX = A * B ...

Sat Apr 14 05:49:00 CST 2018 0 3030
机器学习中的向量求导规则

网上有一些向量求导的总结,把20多种情况一一考虑,很是麻烦,本文希望找出向量求导的基本法则。 向量求导与标量求导法则不同的是,向量的求导还要注意结果的排法问题。注意排法是因为当一个目标函数是多个成分相加时,如果不注意排法可能导致有些结果是行,有些是列,无法继续进行运算。我总结的向量求导的基本推导 ...

Fri Nov 09 23:18:00 CST 2012 2 7045
机器学习】BP & softmax求导

目录 一、BP原理及求导 二、softmax及求导 一、BP 1、为什么沿梯度方向是上升最快方向 根据泰勒公式对f(x)在x0处展开,得到f(x) ~ f(x0) + f'(x0)(x-x0), 故得到f(x) - f(x0) ~ f'(x0)(x-x0 ...

Mon Aug 27 05:50:00 CST 2018 0 836
机器学习中的矩阵向量求导(五) 矩阵对矩阵的求导

    在矩阵向量求导前4篇文章中,我们主要讨论了标量对向量矩阵的求导,以及向量对向量的求导。本文我们就讨论下之前没有涉及到的矩阵对矩阵的求导,还有矩阵对向量,向量对矩阵求导这几种形式的求导方法。     本文所有求导布局以分母布局为准,为了适配矩阵对矩阵的求导,本文向量对向量的求导也以分母布局 ...

Tue May 28 01:19:00 CST 2019 12 11879
机器学习算法推导--矩阵求导中为何会有“转置”?

机器学习算法推导--矩阵求导中为何会有“转置”? 之前学习神经网络推导的时候,发现在有的求导上最后结果需要转置,而有的不需要,很困惑: 浅层神经网络反向传播的困惑 正向传播: 反向传播: 这里为什么要对W进行转置操作?为什么别处有的地方就没有转置操作? 矩阵求导知识 ...

Mon Jan 20 01:06:00 CST 2020 3 4407
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM