語義分割之SegNet


作業內容

1:文字回答:總結對於編碼器解碼器框架以及反池化操作的理解

編碼器解碼器框架:編碼器結構:編碼器部分主要由普通卷積層和下采樣層將特征圖尺寸縮小,使其成為更低維的表征。目的是盡可能多的提取低級特征和高級特征,從而利用提取到的空間信息和全局信息精確分割。

解碼器結構:解碼器部分主要由普通卷積、上采樣層和融合層組成。利用上采樣操作逐步恢復空間維度,融合編碼過程中提取到的特征,在盡可能減少信息損失的前提下完成尺寸輸入輸出。

反池化操作:編碼器中每一個最大池化層的索引都存儲了起來,用於之后在編碼器中使用那些存儲的索引來對相應特征圖進行去池化操作。這有助於保持高頻信息的完整性,但當對低分變率的特征圖進行反池化時,它也會忽略臨近的信息。它是一種上采樣操作,其他上采樣操作還有:插值、反卷積

2:文字回答:用文字描述論文中的Figure 2

 

該圖顯示了SegNet的網絡結構,該網絡編碼器改編了VGG-16,去掉了最后的全連接層,保留了13個卷積層。有5個編碼塊,每個塊后進行降采樣,然后對特征圖進行上采樣,每個上采樣后都有一個解碼塊,一共5個,最后輸出特征圖。該網絡是一個完全對稱的編碼-解碼結構。

3:代碼實現:用SegNet實現對CamVid數據集的分割

4. 論文總結

SegNet: 算法結構:提出了SegNet網絡,其核心的訓練引擎包括一個encoder網絡,和一個對稱的decoder網絡,並跟隨一個用於Pixel-wise的分類層。

創新點:decoder進行上采樣的方式,直接利用與之對應的encoder階段中,在經過最大池化時保留的pooling index進行非線性上采樣。

DeconvNet: 算法結構:提出了深度反卷積網絡,編碼部分使用VGG-16卷積層進行學習,解碼器部分使用反卷積與反池化進行上采樣

創新點:由反卷積和反池化組成上采樣組件,逐像素分類完成預測。

1. 近期的很多cnn網絡,他們的分割結果比較粗糙,原因是因為最大池化和降采樣降低了特征圖的分辨率

2.道路場景理解需要算法具有外形,形狀和理解空間關系的能力。需要產生光滑的分割,網絡也必須能識別小尺寸物體。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM