作者認為語義分割的兩個挑戰是分類和定位,而這兩個挑戰又是比較對立的。對於分類問題,模型需要有變形和旋轉不變形,而對於定位問題,模型有需要對變形敏感。
提出的GCN遵循兩個主要原則:
1、對定位問題,模型需要全卷積來獲得定位信息,不能有全連接或是全局池化層。
2、對分類問題,需要有大的卷積核來連接特征圖和每個像素的分類器
此外還添加了邊界精細塊(boundary refinement block)來代替傳統的CRF后處理
全局卷積時沒有用非線性激活函數,只有卷積層
1*k+k*1的效果比 k*k 和多個小卷積疊加效果好
GCN主要提升了對象內部的正確率,對邊界范圍的影響不大
模型結構如圖: