PSPnet:Pyramid Scene Parsing Network——作者認為現有模型由於沒有引入足夠的上下文信息及不同感受野下的全局信息而存在分割出現錯誤的情景,於是,提出了使用global-scence-level的信息的pspnet


from:https://blog.csdn.net/bea_tree/article/details/56678560

首先聲明,文末彩蛋,不是筆者提問的

1 一句話總結

作者認為現有模型由於沒有引入足夠的上下文信息及不同感受野下的全局信息而存在分割出現錯誤的情景,於是,提出了使用global-scence-level的信息的pspnet,另外本文提出了引入輔助loss的ResNet優化方法。

2 網絡結構

本文提出的網絡結構簡單來說就是將DeepLab(不完全一樣)aspp之前的feature map pooling了四種尺度之后 將5種feature map concat到一起經過卷積最后進行prediction的過程。
這里寫圖片描述

3 ResNet

本文除了網絡之外,其ResNet的模型還是挺強的
這里寫圖片描述
這里寫圖片描述
如上圖,首先作者在訓練的時候加入了輔助loss,另外ResNet起始的7x7的卷積替換了三個3x3的卷積

4 實施細節

  • 使用了poly的學習策略,learning rate 0.01,power 0.9
  • momentum 0.9 weight decay 0.0001
  • random mirror
  • random resize [0.5,2]
  • random rotation [-10 degree,10 degree]
  • random gaussian blur
  • new caffe (batch size 16)
  • auxiliary loss weight to 0.4

5 Ablation study

作者通過實驗,驗證了文中各種設置的作用

5.1 psp net的作用(包括pooling的形式及數量)

這里寫圖片描述

5.2 auxiliary loss

這里寫圖片描述

5.3 pre-trained model

這里寫圖片描述

5.4 其他

這里寫圖片描述

6 知乎上的討論

這里寫圖片描述

這里寫圖片描述


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM