卷積神經網絡之卷積的物理意義


  圖像中的卷積,是離散的,這不同於我們數學中的卷積公式,數學中的卷積公式大部分都是連續的,但是也有離散的卷積公式,學過數字信號處理的應該都知道。這一點是我之前不明白的地方。

  

  正如上圖所示,大的方框表示原圖像的像素,中間小的3*3的方框為卷積模板,最右邊的方框是做完卷積之后的輸出圖像。

  那么,為什么要對圖像做卷積呢?卷積的物理意義是什么呢?經過查閱資料和聽取課程,終於有些明白了為什么要對圖像做卷積。

  如上圖所示,對圖像的卷積就是使卷積模板與原圖像的像素相對應的位置先做乘法然后把相應位置得到的結果進行求和,最終把求和的結果賦給目標像素。如上圖中的計算,最終得到的結果為-8。這里實際上就是做了點積操作,點積的操作就是兩個向量相應位置相乘然后求和。點積的物理意義是兩個向量之間的相似度。推廣到這里,可以說成卷積模板與圖像中某一塊區域的相似度,如果卷積結果越大,說明圖像中的某位置和卷積模板類似,如果卷積結果小,說明圖像中某位置和卷積模板的相似度很小。如果把卷積模板作為特征算子或者特征向量,那么就是不斷的去問被卷積的這張圖像上有哪些部分是符合我這個特征算子的。根據這個特點,如果我們有較好的卷積模板,也就是卷積模板中的元素較好,符合某個特征,就可以檢測圖像中的特征,進而利用特征識別圖像。比如說我這個卷積模板是人的眼睛的特征算子,那么在人的圖像進行完卷積之后,圖像中眼睛部分的響應也就是相似度很高,其他部分的響應或者相似度很小。

  上述只是一個卷積模板或者特征算子,那一個特征顯然不足以區分這個世界。如果我們有千千萬萬個卷積的模板,換句話說你就會有千千萬萬個特征算子,那這些特征會幫助你區分這個世界中的比如貓啊,狗啊,輪船啊等等物體。那么什么是深度卷積神經網絡呢?就是去求解這千千萬萬個卷積模板的這么一種網絡。這些卷積模板可不是隨隨便便憑空得來的,而是要通過不斷的學習得來的。深度卷積神經網絡就是不斷地去學習,最終求得了這些卷積模板。

  

  剛才說到,卷積模板就是特征算子,真的是這樣。比如說如上圖,第一個特征算子實際上在與圖像做完卷積后,輸出還是原圖像,就是對原圖像進行了復制粘貼。第四個特征算子做了邊緣檢測,你看中間的值為8,非常大,邊緣的都是-1,非常小,它突出了中間的像素,弱化了周圍的像素,只有在邊緣的時候才符合這種情況。因為邊緣的灰度變化較大。

  當然,我們可以看到,圖像中的每一部分做完卷積后,在不做任何操作的情況下,輸出的尺寸會小於原圖像的尺寸。比如說原圖像為7 X 7 的尺寸,卷積核為3 X 3的,每次滑動一個小格,那么經過卷積操作后輸出的尺寸為5 X 5的。因為邊緣部分是覆蓋不到的。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM