一、定義
語義圖像分割的目標是標記圖像每個像素的類別。因為我們需要預測圖像中的每個像素,所以此任務通常被稱為密集預測。
二、參考資料
論文:U-Net: Convolutional Networks for Biomedical Image Segmentation
三、網絡結構
四、Transposed Convolutions/ Deconvolution/up convolutions
卷積和池化的輸出相對於輸入尺寸縮小。池化通過增加視場,幫助我們理解圖像中的物體是什么,但是這個操作也丟失了物體的位置信息
●在語義分割中,我們不但需要知道圖像中的物體是什么,還需要知道物體在哪兒我們需要一種將圖像放大同時保留位置信息的操作
●Transposed Convolution是圖像過采樣(up sampling)的最佳選擇,它通過誤差向后傳遞學習最佳的權值使得低分辨率圖像轉換為高分辨率圖像的效果最好.
你可能已經發現輸出的邊緣積累比中心位置少。通常這不是問題,因為內核權重會為此進行調整,也可能是負的。
Conv2DTranspose的問題
●1.與插值法(雙三次插值bicubic)或者最近臨插值相比, Conv2DTranspose是監督式學習算法,是需要訓練的
●2.會產生棋盤效應,其中一個解決方案是先插值,再使用Conv2DTranspose
https://distill.pub/2016/deconv-checkerboard/
五、代碼示例:
代碼下載:https://download.csdn.net/download/qq_34213260/12460227
練習數據:https://www.kaggle.com/c/tgs-salt-identification-challenge/data