常見的激活函數

本文轉載自查看原文 2022-02-15 17:58 967

1. 什么是激活函數

在神經網絡中，我們經常可以看到對於某一個隱藏層的節點，該節點的激活值計算一般分為兩步：
（1）輸入該節點的值為

在深度學習中，常用的激活函數主要有：sigmoid函數，tanh函數，ReLU函數。下面我們將一一介紹。

在邏輯回歸中我們介紹過sigmoid函數，該函數是將取值為

g (z) = 1 1 + e - z

對於sigmoid函數的求導推導為：

sigmoid函數作為非線性激活函數，但是其並不被經常使用，它具有以下幾個缺點：
（1）當

對於隱藏層第一個節點進行計算，假設該點實際值為

z [1] = w 11 x 1 + w 12 x 2 + b [1]

a [1] = g (z [1])

於是對權重

Δ J [ 1 ] ( W ) Δ w 11 = ( a [ 1 ] - a ) \cdot ( a [ 1 ] ) ' = (

由於 $ g'(z^{[1]}) =g(z^{[1]})(1-g(z{[1]}))

tanh函數相較於sigmoid函數要常見一些，該函數是將取值為

g (z) = e z - e - z e z + e - z

tanh函數在

tanh函數的缺點同sigmoid函數的第一個缺點一樣，當

ReLU函數又稱為修正線性單元（Rectified Linear Unit），是一種分段線性函數，其彌補了sigmoid函數以及tanh函數的梯度消失問題。ReLU函數的公式以及圖形如下：

g (z) = {z, 0, if z > 0 if z < 0

對於ReLU函數的求導為：

g' (z) = {1, 0, if z > 0 if z < 0

ReLU函數的優點：
（1）在輸入為正數的時候（對於大多數輸入

這是一種對ReLU函數改進的函數，又稱為PReLU函數，但其並不常用。其公式與圖形如下：

g (z) = {z, a z, if z > 0 if z < 0

其中

g (z) = {1, a, if z > 0 if z < 0

Leaky ReLU函數解決了ReLU函數在輸入為負的情況下產生的梯度消失問題。

我們以這樣一個例子進行理解。
假設下圖中的隱藏層使用的為線性激活函數（恆等激活函數），也就是說

於是我們可以得出：

z [1] = W [1] x + b [1]

a [1] = g (z [1]) = z [1]

z [2] = W [2] a [1] + b [2] = W [2] (W [1] x

a [2] = g (z [2]) = z [2] = W [2] (W [1] x + b

y^= a [2] = W [1] W [2] x + W [2] b [1] + b

可以看出，當激活函數為線性激活函數時，輸出

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 常見的激活函數常見激活函數及其特點常見激活函數介紹常見激活函數求導常見激活函數使用為什么要引入激活函數？激活函數 SELU 激活函數總結激活函數總結激活函數綜述