DeepLab簡單總結


Deeplab v1:

1.條件隨機場(CRF)的作用:
CNN經過多層卷積,獲取足夠多的語義信息,有平移不變性,重復池化和下采樣導致分辨率大幅下降,位置信息丟失難以恢復,
導致最后定位不准,CRF可以解決這個問題(RCF在測試時用,不參與訓練時的反向傳播)

2.deepLab v1創新點:
引入空洞卷積和CRF,都不是原創

3.代碼:https://github.com/wangleihitcs/DeepLab-V1-PyTorch

4.空洞卷積(dilated/Atrous conv)的弊端以及解決方案:https://www.zhihu.com/question/54149221 http://xxx.itp.ac.cn/pdf/1702.08502v3 (HDC)
1)有的像素點可能永遠也卷不到
2)對小物體不友好
5.空洞卷積和等大感受野的大核卷積相比,除了減少參數量以外,還有什么優點嗎?


Deeplab v2:

1. v2創新點有哪些:
論文里提到有三點:atrous conv,ASPP,CRF.實際上相比v1,只增加了ASPP 將網絡VGG16換成了ResNet

2.代碼:https://github.com/doiken23/DeepLab_pytorch/blob/master/DeepLab_v2_res.py

3. ASPP的作用
ASPP通過將特征圖輸入多個膨脹率的空洞卷積中來實現多尺度的,將得到的特征圖直接相加(x = x1 + x2 + x3 + x4),然后上采樣

4.Poly Learning Rate Policy
LearningRate = InitialLearningRate*(1 - iter/max_iter) ^ (power)

Deeplab v3:

1.分割領域的兩個問題:
池化等操作造成的特征圖分辨率降低(空洞卷積解決)
目標多尺度

2.分割中的目標多尺度解決方案:
image pyramid
encoder-decoder structure
extra modules are cascaded on top of the original network
spatial pyramid pooling

3.deeplab v3創新點:
ASPP中增加了圖像級特征、BN
串並聯空洞卷積
將圖像級特征融入ASPP

4.deepLab v3中為什么不使用CRF了?
deeplabv3將圖像級特征融合到ASPP模塊中。融合圖像級特征,相當於融合了其位置信息。所以就不需要最后再用CRF了(https://www.zhihu.com/question/299075713)

5.Deeplabv3的網絡結構:
https://github.com/sthalles/deeplab_v3/blob/master/network.py


Deeplab v3+

1.創新點:
語義分割卷積后的特征圖要插值回原圖大小,直接插值略顯粗糙。
v3+的創新點一是設計基於v3的decode module,二是用modify xception作為backbone
https://blog.csdn.net/Dlyldxwl/article/details/81148810?utm_medium=distribute.pc_relevant_t0.none-task-blog-BlogCommendFromMachineLearnPai2-1.edu_weight&depth_1-utm_source=distribute.pc_relevant_t0.none-task-blog-BlogCommendFromMachineLearnPai2-1.edu_weight
https://blog.csdn.net/weixin_38440272/article/details/84787720?utm_medium=distribute.pc_relevant_right.none-task-blog-BlogCommendFromMachineLearnPai2-3.nonecase&depth_1-utm_source=distribute.pc_relevant_right.none-task-blog-BlogCommendFromMachineLearnPai2-3.nonecase

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM