全連接層有何作用?


1 作用

眾所周知,全連接層之前的作用是提取特征,全連接層的作用是分類。

2 關鍵階段介紹

假設通過CNN已經提取到特征,下一層是全連接層,這個階段比較關鍵,舉個例子說明:

上圖中CNN的輸出是3x3x5的特征圖,它是怎么樣轉換成1x4096的形式呢?

很簡單,可以理解為在中間做了一個卷積。這一步卷積一個非常重要,它的作用就是把分布式特征representation映射到樣本標記空間!

簡單來說:它把特征representation整合到一起,輸出為一個值。這樣做,有一個什么好處:就是大大減少特征位置對分類帶來的影響。

注:樣本標記空間也叫樣本輸出空間。

再舉個例子說明上述的過程:

從上圖我們可以看出,貓在不同的位置,輸出的feature值相同,但是位置不同。對於電腦來說,那分類結果也可能不一樣。

而這時全連接層filter的作用就相當於:貓在哪我不管,只要找到貓就可以,於是讓全連接層filter去把這個貓找到,實際就是把feature map 整合成一個值。

這個值大,有貓,這個值小,那就可能沒貓,這和貓在哪關系不大了,魯棒性大大增強了!

因為空間結構特性被忽略了,所以全連接層不適合用於在方位上找模式的任務,比如分割。

3 全連接層為什么大部分是兩層

只用一層fully connected layer 有時候沒法解決非線性問題,而如果有兩層或以上fully connected layer就可以很好地解決非線性問題了。

4 換個方式講

現在的任務是去識別一圖片是不是貓。

假設這個神經網絡模型已經訓練完了,全連接層已經知道

當我們得到以上特征,我就可以判斷這個是不是貓了,因為全連接層的作用主要就是實現分類(Classification)。

從上圖,可以看出:

紅色的神經元表示這個特征被找到了(激活了),同一層的其他神經元,要么貓的特征不明顯,要么沒找到。

當我們把這些找到的特征組合在一起,發現最符合要求的是貓,則認為這是貓了!


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM