全連接層和激活層

經過前面若干次卷積+激勵+池化后，終於來到了輸出層，模型會將學到的一個高質量的特征圖片全連接層。其實在全連接層之前，如果神經元數目過大，學習能力強，有可能出現過擬合。因此，可以引入dropout操作，來隨機刪除神經網絡中的部分神經元，來解決此問題。還可以進行局部歸一化、數據增強等操作，來增加魯棒性。

當來到了全連接層之后，可以理解為一個簡單的多分類神經網絡（如：BP神經網絡），通過softmax函數得到最終的輸出。整個模型訓練完畢。

兩層之間所有神經元都有權重連接，通常全連接層在卷積神經網絡尾部。也就是跟傳統的神經網絡神經元的連接方式是一樣的：

全連接層（fully connected layers，FC）在整個卷積神經網絡中起到“分類器”的作用。如果說卷積層、池化層和激活函數層等操作是將原始數據映射到隱層特征空間的話，全連接層則起到將學到的“分布式特征表示”映射到樣本標記空間的作用。

全連接的核心操作就是矩陣向量乘積：

y=W*x

本質就是由一個特征空間線性變換到另一個特征空間。目標空間的任一維——也就是隱層的一個 cell——都認為會受到源空間的每一維的影響。不考慮嚴謹，可以說，目標向量是源向量的加權和。

2.激活函數

所謂激活函數（Activation Function），就是在人工神經網絡的神經元上運行的函數，負責將神經元的輸入映射到輸出端。

激活函數（Activation functions）對於人工神經網絡 [1] 模型去學習、理解非常復雜和非線性的函數來說具有十分重要的作用。它們將非線性特性引入到我們的網絡中。如圖1，在神經元中，輸入的 inputs 通過加權，求和后，還被作用了一個函數，這個函數就是激活函數。引入激活函數是為了增加神經網絡模型的非線性。沒有激活函數的每層都相當於矩陣相乘。就算你疊加了若干層之后，無非還是個矩陣相乘罷了。