Caffe學習記錄(十) SegNet等分割網絡學習


圖像分割作為計算機視覺的一個方向,廣泛應用在各個領域,記錄一下學習的過程,以及各個網絡的優缺點,不同的地方等。

最流行的方法是FCN,整個分割的流程大致可以看做如下:

FCN顧名思義,全卷機網絡,就是把fc層都換做1x1的卷積層,channel等價於fc層的輸出個數。

FCN的架構為編碼器,和解碼器組成,編碼器階段為 卷積+池化的下采樣過程, 解碼器階段為卷積+upsampling的過程,最后接上一個1x1的filter進行pixel分類,如下圖

 

上采樣的原因: 池化層會丟失圖像信息和降低圖像分辨率且是不可逆的操作,對圖像分割任務有一些影響。上采樣可以補足一些圖片的信息,但是信息補充的肯定不完全,所以還需要與左邊的分辨率比較高的圖片相連接起來(直接復制過來再裁剪到與上采樣圖片一樣大小),這就相當於在高分辨率和更抽象特征當中做一個折衷,因為隨着卷積次數增多,提取的特征也更加有效,更加抽象。—— jianyuchen23 from zhihu

 

SegNet的全稱是“用於圖像分割的深度卷積編碼器-解碼器架構”

segnet的上采樣是做反向 max pooling, 在做下采樣的時候,segnet會記錄max pooling的index的位置,剩下的部分用0來填充:

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM