ReLU激活函数

本文转载自查看原文 2019-10-10 11:20 1794 深度学习

参考：https://blog.csdn.net/cherrylvlei/article/details/53149381

首先，我们来看一下ReLU激活函数的形式，如下图：

　　单侧抑制，当模型增加N层之后，理论上ReLU神经元的激活率将降低2的N次方倍， ReLU实现稀疏后的模型能够更好地挖掘相关特征，拟合训练数据。此外，相比于其它激活函数来说，ReLU有以下优势：对于线性函数而言，ReLU的表达能力更强，尤其体现在深度网络中；而对于非线性函数而言，ReLU由于非负区间的梯度为常数，因此不存在梯度消失问题(Vanishing Gradient Problem)，使得模型的收敛速度维持在一个稳定状态。这里稍微描述一下什么是梯度消失问题：当梯度小于1时，预测值与真实值之间的误差每传播一层会衰减一次，如果在深层模型中使用sigmoid作为激活函数，这种现象尤为明显，将导致模型收敛停滞不前。

免责声明！

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 激活函数Relu的优点 tensorflow Relu激活函数 ReLU激活函数：简单之美激活函数的比较，sigmoid，tanh，relu sigmod、tanh、ReLU激活函数的实现 ReLu(Rectified Linear Units)激活函数。激活函数（Activation functions）--（sigmoid、tanh、ReLu）深度学习面试题05：激活函数sigmod、tanh、ReLU、LeakyRelu、Relu6 注意力机制+ReLU激活函数=自适应参数化ReLU（深度学习）【深度学习】深入理解ReLU(Rectifie Linear Units)激活函数