CNN詳解——包括反卷積、卷積核的種類


一、卷積網絡基本概念

作用:

也可以稱作為濾波器,是消除噪聲(在圖像上是指引起較強視覺效果的孤立像素點或像素塊),提取主要研究對象。

優點:

參數共享

利用BP自動學習權重特征

缺點:

需要大量的有監督數據

特征:

較淺的卷積層感受野較小,學習到一些局部區域的特征。較深的卷積層具有較大的感受野,能夠學習到更加抽象一些的特征(圖像更加精華的內容)。

具有平移不變性( translation invariance)

圖像的大小不影響卷積。

經過多次卷積(包括pooling)以后,得到的圖像越來越小,分辨率越來越低(粗略的圖像)

具體執行方式:

對應的位置相乘,然后相加即可,這個過程就是卷積

 

 

二、按照卷積核的功用

其中可分為兩種類型,一種是參數值可學習,另一種是參數值不可學習。

1.可學習的卷積核

1)普通卷積核,隨機初始化,具體參數值可通過bp學習

2)高斯卷積核,通過bp學習均值和方差

  對整幅圖像進行加權平均操作的過程。適用於使圖片產生模糊(可以理解成每一個像素都取周邊像素的平均值)的效果。

  卷積核的權重總值等於1。否則的話,使用總值大於1的濾鏡會讓圖像偏亮,小於1的濾鏡會讓圖像偏暗。

2.不可學習的卷積核

1)均值核,去除椒鹽噪聲(所謂椒鹽,椒就是黑,鹽就是白,椒鹽噪聲就是在圖像上隨機出現黑色白色的像素)。

2)空卷積核,只有中心為1,其它都為0,相對於什么也沒有做。

三、按照卷積核的卷積方式

1.反卷積(Deconvolution)

雖然下采樣(downsample),就是pooling不可逆,但是借用反卷積可以做一定程度的還原。

反卷積就是上采樣(upsample),其中包括有轉置卷積、空洞卷積(Dilated convolution)

1)空洞卷積

作用:通過空洞卷積可以在保持卷積核參數大小不變的同時,增大卷積的視野。

借用論文中的圖

(a)是普通的卷積,對應的卷積核是3x3,1-dilated convolution

(b)對應的是3x3的卷積核,2-dilated convolution;相對於7x7的卷積核,1-dilated convolution對應的感受野

(c)對應的是3x3的卷積核,4-dilated convolution;相對於15x15的卷積核,1-dilated convolution對應的感受野

對於空洞部分補0或者是雙線性插值。

原論文:

2)轉置卷積

轉置卷積只能還原shape大小,而不能還原value。

具體操作如下:

 

2.可變性卷積(Deformable Convolutional Network)

卷積核中的每個值均對應一個偏置,達到了卷積不是固定方格的效果,參數量是普通的卷積核的兩倍(多出來的部分是記錄偏置)。

論文參考:

代碼參考: 

 

按照功用分類可參考博客:


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM