卷積層和池化層

本文轉載自查看原文 2016-11-30 22:32 9036 機器學習

卷積神經網絡是在BP神經網絡的改進，與BP類似，都采用了前向傳播計算輸出值，反向傳播調整權重和偏置；CNN與標准的BP最大的不同是：CNN中相鄰層之間的神經單元並不是全連接，而是部分連接，也就是某個神經單元的感知區域來自於上層的部分神經單元，而不是像BP那樣與所有的神經單元相連接。CNN的有三個重要的思想架構：

局部區域感知
權重共享
空間或時間上的采樣

公式參考《Notes on Convolutional Neural Networks》。

1.卷積層前向計算

上面的*號實質是讓卷積核k在第l-1層所有關聯的feature maps上做卷積運算，然后求和，再加上一個偏置參數，取sigmoid得到最終激勵值的過程。

假設第l-1層只有兩個feature map，大小為4*4像素，一個卷積核K(二維卷積核K11和K12)，大小為2*2，則計算第l層的一個feature map結果如下，大小為3*3像素。

（在計算前要把卷積核旋轉180°）第一步在python中的代碼實現如下。

    def conv(self,a, v, full=0):  # valid:0  full:1
        ah, aw = np.shape(a)
        vh, vw = np.shape(v)
        if full:
            temp = np.zeros((ah + 2 * vh - 2, aw + 2 * vw - 2))
            temp[vh - 1:vh - 1 + ah, vw - 1:vw - 1 + aw] = a
            a = temp
            ah, aw = np.shape(a)
        k = [[np.sum(np.multiply(a[i:i+vh,j:j+vw],v))
              for j in range(aw - vw + 1)] for i in range(ah - vh + 1)]
        return k

2.卷積層的殘差計算

其中第l層為卷積層，第l+1層為subsampling層，subsampling層與卷積層是一一對應的。其中up(x)是將第l+1層的大小擴展為和第l層大小一樣。

○指點乘，對應numpy.multiply。

假如第l+1層為2*2的，subsampling的采樣大小為2*2，其中第l+1層的一個feature map所對應的殘差為：

那么擴展之后就變為了

實現代碼如下。

    def up(self,a,n):
        b=np.ones((n,n))
        return np.kron(a,b)

3.卷積層的梯度計算

如卷積層為3*3的大小，卷積核的大小為2*2上一層feature map大小為4*4。

實際等於convolve2d(x^l-1,delta)。

4.subsampling層前向計算

這里的down(x)是將x中采樣大小中像素值進行采樣操作，如求和、最大值。

5.subsampling層殘差計算（假設下一層為卷積層）

對於下圖中第l-1層值為6的元素，根據卷積層前向計算的過程，與第l層的關聯運算如下。

故根據bp算法中殘差計算方法等於第l層與其連接的所有結點的權值和殘差的加權和再乘以該點對z的導數值，相當於用旋轉180度的卷積核直接在下一層卷積層的殘差上做卷積運算，方式為full類型。

6.subsampling層梯度計算（假設下一層為卷積層）

7.Python實現

不使用theano或者類似工具包時，上述一些運算速度很慢，有待優化。

使用了一個卷積層，一個下采樣層，再連接全連接層，softmax輸出。

參考下一篇隨筆（卷積層不用bi，池化層不用w，兩層公用一個激活函數），正確率僅能達到90%左右。

在CNN1 遞歸網絡中進行修改完善。

# coding:utf8
import cPickle
import numpy as np

class ConvLayer(object):  # layer init
    def __init__(self, image_shape,filter_shape):
        self.filter_shape = filter_shape  # 5, 5, 5, 卷積核5*5，5個
        self.image_shape = image_shape  # 28, 28
        self.w = np.random.normal(loc=0, scale=np.sqrt(4.0/125), size=filter_shape)  # 5*5*5/2/2

    def conv(self,a, v, full=0):  # valid:0  full:1
        ah, aw = np.shape(a)
        vh, vw = np.shape(v)
        if full:
            temp = np.zeros((ah + 2 * vh - 2, aw + 2 * vw - 2))
            temp[vh - 1:vh - 1 + ah, vw - 1:vw - 1 + aw] = a
            a = temp
            ah, aw = np.shape(a)
        k = [[np.sum(np.multiply(a[i:i+vh,j:j+vw],v))
              for j in range(aw - vw + 1)] for i in range(ah - vh + 1)]
        return k

    def rot180(self,a):
        temp=np.rot90(a)
        return np.rot90(temp)

    def feedforward(self, a):  #28*28
        self.out = [self.conv(a, self.rot180(w_)) for w_ in self.w]
        #self.out = [sg.convolve2d(a, self.rot180(w_),mode='valid') for w_ in self.w]
        return np.array(self.out)  #5*24*24

    def backprop(self, x, dnext):
        u = self.out  #5*24*24
        delta = [(np.multiply(u_,self.up(d_,2)))
                 for u_,d_ in zip(u,dnext)]
        w = np.array([self.rot180(self.conv(x, d_)) for d_ in delta])
        #w = np.array([self.rot180(sg.convolve2d(x, d_,mode='valid')) for d_ in delta])
        return w

    def up(self,a,l):
        b=np.ones((l,l))
        return np.kron(a,b)

class PoolLayer(object):  # layer init
    def __init__(self, image_shape, poolsize=(2, 2)):
        self.image_shape = image_shape  # 5, 24, 24
        self.poolsize = poolsize  # 2,2
        self.b = np.random.normal(loc=0, scale=1.0, size=(image_shape[0],))  # 5

    def samp(self,a):  # 24*24->12*12
        ah, aw = self.image_shape[1:]  # 24,24
        vh, vw = self.poolsize  # 2,2
        k = [[np.max(a[i*vh:i*vh+vh,j*vw :j*vw+vw]) for j in range(aw / vw)] for i in range(ah / vh)]
        return np.array(k)

    def feedforward(self, a):
        self.out=np.array([self.relu(self.samp(a_)+b_) for a_,b_ in zip(a,self.b)])
        return self.out

    def backprop(self, dnext):
        u=self.out
        delta = np.multiply(dnext, self.relu_prime(u))
        b= np.array([np.sum(d) for d in delta])
        return delta,b

    def relu(self,z):
        return np.maximum(z, 0.0)

    def relu_prime(self,z):
        z[z>0]=1
        return z

class Network(object):
    def __init__(self, sizes):
        self.num_layers = len(sizes)
        self.cl=ConvLayer([28,28],[5,5,5])
        self.pl=PoolLayer([5,24,24],[2,2])
        self.sizes = sizes
        self.biases = [np.random.randn(y) for y in sizes[1:]]
        self.weights = [np.random.randn(y, x)/np.sqrt(y)
                        for x, y in zip(sizes[1:],sizes[:-1])]

    def feedforward(self, x):
        cout=self.cl.feedforward(x)
        pout=self.pl.feedforward(cout)
        a=np.reshape(pout,(1,self.sizes[0]))
        for b_, w_ in zip(self.biases[:-1], self.weights[:-1]):
            a = self.sigmoid(np.dot(a, w_)+b_)
        a=self.softmax(np.dot(a, self.weights[-1])+self.biases[-1])
        return a

    def SGD(self, training_data, test_data,epochs, mini_batch_size, eta=0.01):
        n_test = len(test_data)
        self.n = len(training_data)
        self.mini_batch_size=mini_batch_size
        self.eta=eta
        cx=range(epochs)
        for j in cx:
            np.random.shuffle(training_data)
            for k in xrange(0, self.n , mini_batch_size):
                mini_batch = training_data[k:k+mini_batch_size]
                self.update_mini_batch(mini_batch)
                if k%1000==0:
                    print "Epoch {0}:{1}  train: {2} / {3}  cost={4}, test: {5} / {6}".format(j,k,
                    self.evaluate(training_data[:500],1),500 ,self.cost, self.evaluate(test_data), n_test)

    def update_mini_batch(self, mini_batch):
        for x, y in mini_batch:
            self.backprop(x, y)

    def backprop(self, x_in, y):
        b=np.zeros_like(self.biases)
        w=np.zeros_like(self.weights)
        cout=self.cl.feedforward(x_in)
        pout=self.pl.feedforward(cout)
        x=np.reshape(pout,(1,self.sizes[0]))
        a_ = x
        a = [x]
        for b_, w_ in zip(self.biases, self.weights):
            a_ = self.sigmoid(np.dot(a_, w_)+b_)
            a.append(a_)
        for l in xrange(1, self.num_layers):
            if l==1:
                delta =self.softmax(np.dot(a[-2],w_) + b_)-y
            else:
                sp=self.sigmoid_prime(a[-l])
                delta = np.dot( delta,self.weights[-l+1].T) * sp
            b[-l] = delta
            w[-l] = np.dot( a[-l-1].T,delta)
        self.weights-=self.eta*(w)
        self.biases -= self.eta*b
        dnext=np.dot(delta,self.weights[0].T)
        dnext=np.reshape(dnext,(5,12,12))

        delta_p,delta_pb=self.pl.backprop(dnext)
        self.pl.b-=self.eta*delta_pb
        delta_cw=self.cl.backprop(x_in,delta_p)
        self.cl.w-=self.eta*delta_cw

    def evaluate(self, test_data, train=0):
        if train:
            xy=[(self.feedforward(x),np.argmax(y)) for (x, y) in test_data]
            test_results = [(np.argmax(x), y)
                            for (x, y) in xy]
            xl=[x[0] for x,_ in xy]
            yl=[y for _,y in xy]
            self.cost = -np.mean(np.log(xl)[np.arange(500),yl])
        else:
            test_results = [(np.argmax(self.feedforward(x)), y)
                            for (x, y) in test_data]
        return sum(int(x == y) for (x, y) in test_results)

    def sigmoid(self,z):
        return 1.0/(1.0+np.exp(-z))

    def sigmoid_prime(self,z):
        return z*(1-z)

    def softmax(self,a):
        m = np.exp(a)
        return m / np.sum(m,axis=1)

def get_label(i):
    c=np.zeros((10))
    c[i]=1
    return c

if __name__ == '__main__':
        def get_data(data):
            return [np.reshape(x, (28,28)) for x in data[0]]

        f = open('data/mnist.pkl', 'rb')
        training_data, validation_data, test_data = cPickle.load(f)
        training_inputs = get_data(training_data)
        training_label=[get_label(y_) for y_ in training_data[1]]
        data = zip(training_inputs,training_label)
        test_inputs = training_inputs = get_data(test_data)
        test = zip(test_inputs,test_data[1])
        net = Network([720, 100, 10])
        net.SGD(data,test[:500],epochs=10,mini_batch_size=10, eta=0.001)

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 卷積層與池化層 CNNs中的卷積層和池化層卷積層和池化層學習『TensorFlow』卷積層、池化層詳解卷積層+池化層的理解卷積神經網絡_（1）卷積層和池化層學習卷積神經網絡中卷積層和池化層卷積神經網絡：卷積層和池化層 Keras卷積+池化層學習 tensorflow中的卷積和池化層(一)