1、二維互相關運算
在二維卷積層中,一個二維輸入數組和一個二維核數組通過互相關運算輸出一個二維數組;核數組在卷積運算中又稱卷積核、過濾器、卷積窗口;輸出形狀取決於卷積核和輸入的形狀
如,二維輸入數組(3X3)與二維核數組(2X2)互相關運算,產生結果是一個二維數組(2X2),卷積核按照從左往右,從上往下的順序依次在輸入數組上滑動,計算結果
輸⼊形狀是nh× nw,卷積窗口形狀是kh× kw,輸出形狀
(nh− kh+ 1) × (nw− kw+ 1).
2、二維卷積層
二維卷積層將輸入和卷積核做互相關運算,然后加上一個標量偏差得到輸出。卷積層的模型參數包括了卷積核和標量偏差
3、填充和步幅---卷積層的超參數
(1)填充
填充是指在輸入的高、寬兩側填充元素(通常為0)。在高的兩側一共填充ph⾏,在寬的兩側一共填充pw列,則輸出的高和寬也會分別增加ph和pw。很多情況下,會設置ph=kh-1,pw=kw-1來使輸入和輸出具有同樣的形狀。當kh為奇數時,在高的兩側分別填充ph/2行;為偶數時,在輸入的頂端填充⌈ph/2⌉行,在低端填充⌊ph/2⌋行
輸⼊形狀是nh× nw,卷積窗口形狀是kh× kw,在⾼的兩側⼀共填充ph⾏,寬的兩側⼀共填充pw列,輸出形狀
(nh− kh+ ph+ 1) × (nw− kw+ pw+ 1),
(2)步幅
卷積窗口按照從左往右,從上往下的順序依次在輸入數組上滑動,每次滑動的行數和列數稱為步幅,高和寬滑動的步幅可以不一樣。
輸入為5X5,卷積核為3X3,高寬步幅為2,填充為1的卷積計算過程如下,輸出為3X3
輸⼊形狀是nh× nw,卷積窗口形狀是kh× kw,在⾼的兩側⼀共填充ph⾏,寬的兩側⼀共填充pw列,⾼上步幅為sh,寬上幅為sw,輸出形狀
⌊(nh− kh+ ph+ sh)/sh⌋ × ⌊(nw− kw+ pw+ sw)/sw⌋
若,ph=kh-1,pw=kw-1,輸出形狀
⌊(nh+sh−1)/sh⌋×⌊(nw+sw−1)/sw⌋
填充用來增加輸出的寬和高,使輸出和輸入寬高相同;步幅用來減少輸出的寬和高
4、多輸入通道
彩色圖像有高h和寬w2個維度外還有RGB(紅、綠、藍)3個顏色通道,則可以表示為3*h*w的多維數組,其中3這一維稱為通道維
當輸入數據含有多個通道時,需要構造一個輸入通道數與輸入數據通道數相同的卷積核。假設輸入數據通道數為ci,卷積核的輸入通道數同樣為ci.設卷積核窗口形狀為kh× kw,當ci>1時,為每個輸入通道各分配一個形狀為kh× kw的核數組,把這ci個數組在輸入通道維上連結,即得到一個ci× kh× kw的卷積核
如下圖,2個輸入通道的互相關計算
5、多輸出通道
卷積核輸⼊通道數和輸出通道數分別為ci和co,⾼和分別為kh和kw,卷積核的形狀即co× ci× kh× kw。
如圖,輸入通道數為3,輸出通道數為2,卷積核形狀為2 x 3 x 1 x 1