神經網絡中的激活函數tanh sigmoid RELU softplus softmatx

本文轉載自查看原文 2017-05-11 11:04 6070 隨手記

所謂激活函數，就是在神經網絡的神經元上運行的函數，負責將神經元的輸入映射到輸出端。常見的激活函數包括Sigmoid、TanHyperbolic(tanh)、ReLu、 softplus以及softmax函數。這些函數有一個共同的特點那就是他們都是非線性的函數。那么我們為什么要在神經網絡中引入非線性的激活函數呢？引用https://www.zhihu.com/question/29021768的解釋就是：

如果不用激勵函數（其實相當於激勵函數是f(x) = x），在這種情況下你每一層輸出都是上層輸入的線性函數，很容易驗證，無論你神經網絡有多少層，輸出都是輸入的線性組合，與沒有隱藏層效果相當，這種情況就是最原始的感知機（Perceptron）了。
正因為上面的原因，我們決定引入非線性函數作為激勵函數，這樣深層神經網絡就有意義了（不再是輸入的線性組合，可以逼近任意函數）。最早的想法是sigmoid函數或者tanh函數，輸出有界，很容易充當下一層輸入（以及一些人的生物解釋balabala）。

　　由此可見，激活函數對神經網絡的深層抽象功能有着極其重要的意義。下面分別對上述激活函數進行說明：

Sigmoid函數

　　Sigmoid函數的表達式為

TanHyperbolic(tanh)函數

　　TanHyperbolic(tanh)函數又稱作雙曲正切函數，數學表達式為

ReLu函數和softplus函數

　　ReLu函數的全稱為Rectified Linear Units，函數表達式為

第一，采用sigmoid等函數，算激活函數時（指數運算），計算量大，反向傳播求誤差梯度時，求導涉及除法，計算量相對大，而采用Relu激活函數，整個過程的計算量節省很多。
第二，對於深層網絡，sigmoid函數反向傳播時，很容易就會出現梯度消失的情況（在sigmoid接近飽和區時，變換太緩慢，導數趨於0，這種情況會造成信息丟失），從而無法完成深層網絡的訓練。
第三，Relu會使一部分神經元的輸出為0，這樣就造成了網絡的稀疏性，並且減少了參數的相互依存關系，緩解了過擬合問題的發生（以及一些人的生物解釋balabala）。

如果想要了解更多的話，http://www.cnblogs.com/neopenx/p/4453161.html對softplus進行了詳細的介紹，這里不再贅述。

softmax函數

　　我們可以看到，Sigmoid函數實際上就是把數據映射到一個

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 【python實現卷積神經網絡】激活函數的實現（sigmoid、softmax、tanh、relu、leakyrelu、elu、selu、softplus）神經網絡中的激活函數具體是什么？為什么Relu要好過與tanh和sigmoid function 神經網絡激活函數sigmoid relu tanh 為什么sigmoid 容易梯度消失神經網絡激活函數softmax，sigmoid，tanh，relu總結深度學習的激活函數：sigmoid、tanh、ReLU 、Leaky Relu、RReLU、softsign 、softplus、GELU Java實現的簡單神經網絡(基於Sigmoid激活函數) 激活函數（Sigmod、tanh、Relu）淺談神經網絡中的激活函數 TensorFlow神經網絡中的激活函數神經網絡中的Softmax激活函數