一、卷積網絡基本概念
作用:
也可以稱作為濾波器,是消除噪聲(在圖像上是指引起較強視覺效果的孤立像素點或像素塊),提取主要研究對象。
優點:
參數共享
利用BP自動學習權重特征
缺點:
需要大量的有監督數據
特征:
較淺的卷積層感受野較小,學習到一些局部區域的特征。較深的卷積層具有較大的感受野,能夠學習到更加抽象一些的特征(圖像更加精華的內容)。
具有平移不變性( translation invariance)
圖像的大小不影響卷積。
經過多次卷積(包括pooling)以后,得到的圖像越來越小,分辨率越來越低(粗略的圖像)
具體執行方式:
對應的位置相乘,然后相加即可,這個過程就是卷積
二、按照卷積核的功用
其中可分為兩種類型,一種是參數值可學習,另一種是參數值不可學習。
1.可學習的卷積核
1)普通卷積核,隨機初始化,具體參數值可通過bp學習
2)高斯卷積核,通過bp學習均值和方差
對整幅圖像進行加權平均操作的過程。適用於使圖片產生模糊(可以理解成每一個像素都取周邊像素的平均值)的效果。
卷積核的權重總值等於1。否則的話,使用總值大於1的濾鏡會讓圖像偏亮,小於1的濾鏡會讓圖像偏暗。
2.不可學習的卷積核
1)均值核,去除椒鹽噪聲(所謂椒鹽,椒就是黑,鹽就是白,椒鹽噪聲就是在圖像上隨機出現黑色白色的像素)。
2)空卷積核,只有中心為1,其它都為0,相對於什么也沒有做。
三、按照卷積核的卷積方式
1.反卷積(Deconvolution)
雖然下采樣(downsample),就是pooling不可逆,但是借用反卷積可以做一定程度的還原。
反卷積就是上采樣(upsample),其中包括有轉置卷積、空洞卷積(Dilated convolution)
1)空洞卷積
作用:通過空洞卷積可以在保持卷積核參數大小不變的同時,增大卷積的視野。
借用論文中的圖
(a)是普通的卷積,對應的卷積核是3x3,1-dilated convolution
(b)對應的是3x3的卷積核,2-dilated convolution;相對於7x7的卷積核,1-dilated convolution對應的感受野
(c)對應的是3x3的卷積核,4-dilated convolution;相對於15x15的卷積核,1-dilated convolution對應的感受野
對於空洞部分補0或者是雙線性插值。
原論文:https://arxiv.org/pdf/1511.07122v2.pdf
2)轉置卷積
轉置卷積只能還原shape大小,而不能還原value。
具體操作如下:
2.可變性卷積(Deformable Convolutional Network)
卷積核中的每個值均對應一個偏置,達到了卷積不是固定方格的效果,參數量是普通的卷積核的兩倍(多出來的部分是記錄偏置)。
代碼參考: https://github.com/msracver/Deformable-ConvNets
按照功用分類可參考博客:https://www.jianshu.com/p/8d2d93c42