FCN 全連接網絡


CNN能夠對圖片進行分類,可是怎么樣才能識別圖片中特定部分的物體、

通常CNN網絡在卷積層之后會接上若干個全連接層, 將卷積層產生的特征圖(feature map)映射成一個固定長度的特征向量。

以AlexNet為代表的經典CNN結構適合於圖像級的分類和回歸任務,因為它們最后都期望得到整個輸入圖像的一個數值描述(概率),

比如AlexNet的ImageNet模型輸出一個1000維的向量表示輸入圖像屬於每一類的概率(softmax歸一化)。

 

下圖中的貓, 輸入AlexNet, 得到一個長為1000的輸出向量, 表示輸入圖像屬於每一類的概率, 其中在“tabby cat”這一類統計概率最高。

 

 FCN對圖像進行像素級的分類,從而解決了語義級別的圖像分割(semantic segmentation)問題。與經典的CNN在卷積層之后使用全連接層得到固定長度的特征向量進行分類(全聯接層+softmax輸出)不同,FCN可以接受任意尺寸的輸入圖像,采用反卷積層對最后一個卷積層的feature map進行上采樣, 使它恢復到輸入圖像相同的尺寸,從而可以對每個像素都產生了一個預測, 同時保留了原始輸入圖像中的空間信息, 最后在上采樣的特征圖上進行逐像素分類。

 

最后逐個像素計算softmax分類的損失, 相當於每一個像素對應一個訓練樣本。下圖是用於語義分割所采用的全卷積網絡(FCN)的結構示意圖:

 

 簡單的來說,FCN與CNN的區域在把於CNN最后的全連接層換成卷積層,輸出的是一張已經Label好的圖片。

 

 

 其實,CNN的強大之處在於它的多層結構能自動學習特征,並且可以學習到多個層次的特征:較淺的卷積層感知域較小,學習到一些局部區域的特征;較深的卷積層具有較大的感知域,能夠學習到更加抽象一些的特征。這些抽象特征對物體的大小、位置和方向等敏感性更低,從而有助於識別性能的提高


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM