卷積神經網絡中的卷積核是如何進行運算的


本筆記為自用總結。

倘若想學習,請參考一下兩個鏈接即可。

卷積運算和運算后特征圖大小計算1_胡侃有料的博客-CSDN博客_卷積特征圖大小計算

CNN中卷積層的計算細節


一張RGB的三通道彩色影像,被numpy或其他模塊里的函數讀取到網絡里后,是三通道的影像。

卷積神經網絡中的卷積部分,在模型運行的過程中,不僅會改變影像的長寬,也會改變其深度(也就是通道的數量)。

一張227 x 227 x 3的圖像

96個卷積核,每個卷積核的尺寸是11 x 11 x 3,步長為4,padding=0

輸出為55 x 55 x 96


不論卷積核的數量,首先應當了解的是利用卷積核進行計算的思想:輸入圖像和卷積核的對應通道進行相乘再相加。且一個卷積核(其通道數和要相乘的圖片的通道數是一致的)對應的輸出數據只有一個通道!!!

倘若在代碼中或文章中,沒有注明卷積核本身的通道數,那么默認和輸入通道數相同。

上兩句一直是我學習過程中的疑惑重點。尤其是卷積核的通道數到底有多少個?為什么相乘了以后的輸出就恰好等於卷積核的個數?

以上面的96個11 x 11 x 3卷積核為例,每一個卷積核的通道數都與輸入圖像的相同,那就是三個通道。然后每個通道與對應的輸入圖像的通道相乘,得到一個結果,三個通道就是三個結果,這三個結果相加得到一個最終的結果。那么一共96個通道,就會是96個輸出。


1 x 1 的卷積核

這種卷積核的作用是將輸入矩陣的通道數量縮減后輸出。

全連接層也可以視作是特殊的卷積


卷積核做的,就是與感受野范圍內的像素點進行點積(非矩陣乘法)。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM