如何理解卷積


1、什么是卷積:圖像中不同數據窗口的數據和卷積核(一個濾波矩陣)做內積的操作叫做卷積,該計算過程又稱為濾波(filter),本質是提取圖像不同頻段的特征。

2、什么是卷積核:也稱為濾波器filter,帶着一組固定權重的神經元,通常是n*m二維的矩陣,n和m也是神經元的感受野。n*m矩陣中存的是對感受野中數據處理的系數。一個卷積核的濾波可以用來提取特定的特征(例如可以提取物體的輪廓、顏色深淺等)。通過卷積層從原始數據中提取出新的特征的過程又稱為feature map(特征映射)。filter_size是指filter的大小,例如3*3;filter_num是指每種filter_size的filter個數,通常是通道個數

3、什么是卷積層:多個濾波器疊加便成了卷積層。

4、一個卷積層有多少個參數:一個卷積核使用一套權值以便“掃視”數據每一處時以同樣的方式抽取特征,最終得到的是一種特征。在tensorflow定義conv2d時需要指定卷積核的尺寸,本人現在的理解是一個卷積層的多個卷積核使用相同的m*n,只是權重不同。則一個卷積層的參數總共m*n*filter_num個,比全連接少了很多。

5、通道怎么理解:通道可以理解為視角、角度。例如同樣是提取邊界特征的卷積核,可以按照R、G、B三種元素的角度提取邊界,RGB在邊界這個角度上有不同的表達;再比如需要檢查一個人的機器學習能力,可以從特征工程、模型選擇、參數調優等多個方面檢測。

6、幾個參數

深度depth:神經元個數,決定輸出的depth厚度同時代表濾波器的個數

步長stride:決定滑動多少步可以到邊緣。

填充值zero-padding:再外圍邊緣補充若干圈0,方便從初始位置以步長為單位可以剛好滑倒末尾位置,通俗地講就是為了總長能被步長整除。

上面的兩個例子中:

五個神經元,即depth=5,意味着有5個濾波器。

數據窗口每次移動兩個步長取3*3的局部數據,即stride=2(步長是步子大小,不是步數)

zero=padding=1

 

7、如何理解權值共享,減少了神經網絡需要訓練的參數的個數?

數據窗口滑動,導致輸入在變化,但中間濾波器Filter W0的權重是固定不變的,這個權重不變即所謂的CNN中的參數(權重)共享機制。

 

 

 

 

 

 

        

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM