卷積神經網絡真的挺難靠文字講清楚的,一般需要大量圖片來輔助理解,時間關系,我就不仔細講了,這里記錄一下大致的算法和注意點。
首先我概括一下卷積神經網絡
卷積神經網絡是通過卷積核進行特征提取,從一個樣本身上利用很多個卷積核提取這個樣本的很多特征,通過池化進行降維,然后利用普通的全連接神經網絡進行訓練。
從網絡結構上講,卷積神經網絡是把網絡從扁平拉伸成窄厚,然后重復這個過程,最后接上全連接網絡和softmax。
接着我講幾個注意點
卷積層和池化層
卷積層的核心是卷積核,我在手寫數字識別實例中已經講的比較清楚,不再贅述。
池化層的作用不只是降維,它使得模型對局部位移或者微小位置偏差具有更好的魯棒性
輸入有微小差別,輸出相同
padding
在卷積層和池化層,padding的意義是不同的。
卷積層
padding取same時,需要對原樣本進行邊界填充,以保證卷積后的樣本和原樣本大小一樣,
padding取valid時,不需要填充,卷積后變小。
池化層
padding取same時,可能會給平面進行邊界填充,但不是保證大小一致,是在池化野掃描時,假如掃描到邊界時,剩余的格數小於池化野的大小時,對邊界填充,使得剩余格數等於池化野大小,否則不需要填充。
padding取valid時,不填充,假如掃描到邊界時,剩余格數小於池化野的大小,就放棄剩余的格數
最后接兩張關鍵圖結束