原文地址:https://baijiahao.baidu.com/s?id=1590121601889191549&wfr=spider&for=pc
今天要說的是CNN最后一層了,CNN入門就要講完啦。。。。。
先來一段官方的語言介紹全連接層(Fully Connected Layer)
全連接層常簡稱為 FC,它是可能會出現在 CNN 中的、一個比較特殊的結構;從名字就可以大概猜想到、FC 應該和普通層息息相關,事實上也正是如此。直觀地說、FC 是連接卷積層和普通層的普通層,它將從父層(卷積層)那里得到的高維數據鋪平以作為輸入、進行一些非線性變換(用激活函數作用)、然后將結果輸進跟在它后面的各個普通層構成的系統中:

上圖中的 FC 一共有3*2*2 =12個神經元,自 FC 之后的系統其實就是NN。換句話說、我們可以把 CNN 拆分成如下兩塊結構:
自輸入開始、至 FC 終止的“卷積塊”,組成卷積塊的都是卷積層自 FC 開始、至輸出終止的“NN 塊”,組成 NN 塊的都是普通層
注意:值得一提的是,在許多常見的網絡結構中、NN 塊里都只含有 FC 這個普通層
明白了沒有?各位看官
沒有?
說白了全連接就是一個分類器,LR知道不?
邏輯回歸懂不懂?
將上層抽取出來的特征向量在里面做一個權重計算,輸出各個類別的概率,就是這個,沒了。
那么為什么 CNN 會有 FC 這個結構呢?
或者問得更具體一點、為什么要將總體分成卷積塊和 NN 塊兩部分呢?
這其實從直觀上來說非常好解釋:卷積塊中的卷積的基本單元是局部視野,用它類比我們的眼睛的話、就是將外界信息翻譯成神經信號的工具,它能將接收的輸入中的各個特征提取出來;至於 NN(神經網絡)塊、則可以類比我們的神經網絡(甚至說、類比我們的大腦),它能夠利用卷積塊得到的信號(特征)來做出相應的決策。概括地說、CNN 視卷積塊為“眼”而視 NN 塊為“腦”,眼腦結合則決策自成。
用機器學習的術語來說、則卷積塊為“特征提取器”而 NN 塊為“決策分類器”,
而他的作用就是:全連接層則起到將學到的“分布式特征表示”映射到樣本標記空間的作用
而事實上,CNN 的強大之處其實正在於其卷積塊強大的特征提取能力上、NN 塊甚至可以說只是用於分類的一個附屬品而已。我們完全可以利用 CNN 將特征提取出來后、用之前介紹過的決策樹、支持向量機等等來進行分類這一步而無須使用 NN 塊。