相關內容簡體繁體

CNN學習筆記：激活函數

本文轉載自查看原文 2019-02-08 11:04 725 Python[神經網絡]

CNN學習筆記：激活函數

激活函數

　　激活函數又稱非線性映射，顧名思義，激活函數的引入是為了增加整個網絡的表達能力（即非線性）。若干線性操作層的堆疊仍然只能起到線性映射的作用，無法形成復雜的函數。常用的函數有sigmoid、雙曲正切、線性修正單元函數等等。使用一個神經網絡時，需要決定使用哪種激活函數用隱藏層上，哪種用在輸出節點上。

　　比如，在神經網路的前向傳播中，

sigmoid函數

　　之前在線性回歸中，我們用過這個函數，使我們的輸出值平滑地處於0~1之間。

　　

　　觀察圖形我們發現，當大於5或者小於-5的值無論多大或多小都會被壓縮到1或0。如此便帶來一個嚴重問題，即梯度的“飽和效應”。大於5或者小於-5部分的梯度接近0，這回導致在誤差反向傳播過程中導數處於該區域的誤差就很難甚至根本無法傳遞至前層，進而導致整個網絡無法訓練（導數為0將無法跟新網絡參數）。

　　此外，在參數初始化的時候還需要特別注意，要避免初始化參數直接將輸出值帶入這一區域，比如初始化參數過大，將直接引發梯度飽和效應而無法訓練。

說明：除非輸出層是一個二分類問題否則基本不會用它。

雙曲正切函數

　　tanh函數是sigmoid的向下平移和伸縮后的結果。對它進行了變形后，穿過了原

　　

　　結果表明，如果在隱藏層上使用函數tanh

　　

　　Relu作為神經元的激活函數，定義了該神經元在線性變換 $\mathbf {w} ^{T}\mathbf {x} +b$ $\max(0,\mathbf {w} ^{T}\mathbf {x} +b)$ 至下一層神經元或作為整個神經網絡的輸出（取決現神經元在網絡結構中所處位置）。

　　只要

選擇激活函數的經驗法則：

　　如果輸出是0、1值（二分類問題），則輸出層選擇sigmoid函數，然后其它的所有單元都選擇Relu函數。

　　最常用的默認函數，，如果不確定用哪個激活函數，就使用ReLu或者Leaky ReLu

帶泄露線性整流函數（Leaky ReLU）

　　在輸入值 $\lambda \in (0,1)$

　　在深度學習中，如果設定 $\lambda$

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 記-CNN中的激活函數深度學習Keras框架筆記之激活函數詳解深度學習激活函數 keras模塊學習之-激活函數（activations）--筆記深度學習激活函數們深度學習中常用的激活函數深度學習常用激活函數深度學習中的激活函數深度學習激活函數比較深度學習中的激活函數

粵ICP備18138465號 © 2018-2026 CODEPRJ.COM