語義分割(semantic segmentation)——U-Net


一、定義

語義圖像分割的目標是標記圖像每個像素的類別。因為我們需要預測圖像中的每個像素,所以此任務通常被稱為密集預測。

二、參考資料

論文:U-Net: Convolutional Networks for Biomedical Image Segmentation

三、網絡結構

在這里插入圖片描述

四、Transposed Convolutions/ Deconvolution/up convolutions

在這里插入圖片描述
卷積和池化的輸出相對於輸入尺寸縮小。池化通過增加視場,幫助我們理解圖像中的物體是什么,但是這個操作也丟失了物體的位置信息
●在語義分割中,我們不但需要知道圖像中的物體是什么,還需要知道物體在哪兒我們需要一種將圖像放大同時保留位置信息的操作
●Transposed Convolution是圖像過采樣(up sampling)的最佳選擇,它通過誤差向后傳遞學習最佳的權值使得低分辨率圖像轉換為高分辨率圖像的效果最好.
在這里插入圖片描述在這里插入圖片描述
在這里插入圖片描述你可能已經發現輸出的邊緣積累比中心位置少。通常這不是問題,因為內核權重會為此進行調整,也可能是負的。

加粗樣式在這里插入圖片描述

Conv2DTranspose的問題

●1.與插值法(雙三次插值bicubic)或者最近臨插值相比, Conv2DTranspose是監督式學習算法,是需要訓練的
●2.會產生棋盤效應,其中一個解決方案是先插值,再使用Conv2DTranspose
在這里插入圖片描述https://distill.pub/2016/deconv-checkerboard/

五、代碼示例:

代碼下載:https://download.csdn.net/download/qq_34213260/12460227
練習數據:https://www.kaggle.com/c/tgs-salt-identification-challenge/data


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM