機器學習筆記:形象的解釋神經網絡激活函數的作用是什么?


此文轉自知乎,哈工大NLPer 憶臻

原出處:https://zhuanlan.zhihu.com/p/25279356

查閱資料和學習,大家對神經網絡中激活函數的作用主要集中下面這個觀點:

  • 激活函數是用來加入非線性因素的,解決線性模型所不能解決的問題。

下面我分別從這個方面通過例子給出自己的理解~

@lee philip@顏沁睿倆位的回答已經非常好了,我舉的例子也是來源於他們,在這里加入了自己的思考,更加詳細的說了一下~

開講~

首先我們有這個需求,就是二分類問題,如我要將下面的三角形和圓形點進行正確的分類,如下圖:

利用我們單層的感知機, 用它可以划出一條線, 把平面分割開:

 

上圖直線是由w_{1}x_{1} + w_{2}x_{2}+b=0 得到,那么該感知器實現預測的功能步驟如下,就是我已經訓練好了一個感知器模型,后面對於要預測的樣本點,帶入模型中,如果y>0,那么就說明是直線的右側,也就是正類(我們這里是三角形),如果y<0,那么就說明是直線的左側,也就是負類(我們這里是圓形),雖然這和我們的題目關系不大,但是還是提一下~

好吧,很容易能夠看出,我給出的樣本點根本不是線性可分的,一個感知器無論得到的直線怎么動,都不可能完全正確的將三角形與圓形區分出來,那么我們很容易想到用多個感知器來進行組合,以便獲得更大的分類問題,好的,下面我們上圖,看是否可行:

好的,我們已經得到了多感知器分類器了,那么它的分類能力是否強大到能將非線性數據點正確分類開呢~我們來分析一下:

我們能夠得到y=w_{2-1}(w_{1-11}x_{1}+ w_{1-21}x_{2}+b_{1-1}  )+ w_{2-2}(w_{1-12}x_{1}+ w_{1-22}x_{2}+b_{1-2}  )+w_{2-3}(w_{1-13}x_{1}+ w_{1-23}x_{2}+b_{1-3}  )

哎呀呀,不得了,這個式子看起來非常復雜,估計應該可以處理我上面的情況了吧,哈哈哈哈~不一定額,我們來給它變個形.上面公式合並同類項后等價於下面公式:

y=x_{1}(w_{2-1}w_{1-11}+w_{2-2}w_{1-12} +w_{2-3}w_{1-13}  )+x_{2} (w_{2-1}w_{1-21}+w_{2-2}w_{1-22} +w_{2-3}w_{1-23}  )+w_{2-1} b_{1-1}  +w_{2-2} b_{1-2}+w_{2-3} b_{1-3}

嘖嘖,估計大家都看出了,不管它怎么組合,最多就是線性方程的組合,最后得到的分類器本質還是一個線性方程,該處理不了的非線性問題,它還是處理不了。

就好像下圖,直線無論在平面上如果旋轉,都不可能完全正確的分開三角形和圓形點:

既然是非線性問題,總有線性方程不能正確分類的地方~

那么拋開神經網絡中神經元需不需要激活函數這點不說,如果沒有激活函數,僅僅是線性函數的組合解決的問題太有限了,碰到非線性問題就束手無策了.那么加入激活函數是否可能能夠解決呢?

在上面線性方程的組合過程中,我們其實類似在做三條直線的組合,如下圖:

下面我們來講一下激活函數,我們都知道,每一層疊加完了之后,我們需要加入一個激活函數(激活函數的種類也很多,如sigmoid等等~)這里就給出sigmoid例子,如下圖:

通過這個激活函數映射之后,輸出很明顯就是一個非線性函數!能不能解決一開始的非線性分類問題不清楚,但是至少說明有可能啊,上面不加入激活函數神經網絡壓根就不可能解決這個問題~

同理,擴展到多個神經元組合的情況時候,表達能力就會更強~對應的組合圖如下:(現在已經升級為三個非線性感知器在組合了)

跟上面線性組合相對應的非線性組合如下:

這看起來厲害多了,是不是~最后再通過最優化損失函數的做法,我們能夠學習到不斷學習靠近能夠正確分類三角形和圓形點的曲線,到底會學到什么曲線,不知道到底具體的樣子,也許是下面這個~

那么隨着不斷訓練優化,我們也就能夠解決非線性的問題了~

所以到這里為止,我們就解釋了這個觀點,加入激活函數是用來加入非線性因素的,解決線性模型所不能解決的問題。

注:參考於@lee philip@顏沁睿倆位的回答,以上圖片大部分摘自於@顏沁睿

感謝郭江師兄,森棟師兄,德川的討論交流~

希望知友提出問題一起交流~

最近開通了個人公眾號 [憶臻筆記] 或者微信號 [yizhennotes],用於記錄自己在本科,碩士甚至博士期間關於ml,nlp學習和生活的筆記和感悟,可能沒有很難很偏的知識,但一定是我理解的干貨~歡迎掃描下面二維碼關注一波~期待和你一起學習交流~


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM