神經網絡、logistic回歸等分類算法簡單實現

本文轉載自查看原文 2016-04-16 23:12 2445 python/ logistic/ 機器學習/ 深度學習/ neural network

最近在github上看到一個很有趣的項目，通過文本訓練可以讓計算機寫出特定風格的文章，有人就專門寫了一個小項目生成汪峰風格的歌詞。看完后有一些自己的小想法，也想做一個玩兒一玩兒。用到的原理是深度學習里的循環神經網絡，無奈理論太艱深，只能從頭開始開始慢慢看，因此產生寫一個項目的想法，把機器學習和深度學習里關於分類的算法整理一下，按照原理寫一些demo，方便自己也方便其他人。項目地址：https://github.com/LiuRoy/classfication_demo，目前實現了邏輯回歸和神經網絡兩種分類算法。

Logistic回歸

這是相對比較簡單的一種分類方法，准確率較低，也只適用於線性可分數據，網上有很多關於logistic回歸的博客和文章，講的也都非常通俗易懂，就不贅述。此處采用隨機梯度下降的方式實現，講解可以參考《機器學習實戰》第五章logistic回歸。代碼如下：

def train(self, num_iteration=150):
    """隨機梯度上升算法

    Args:
        data (numpy.ndarray): 訓練數據集
        labels (numpy.ndarray): 訓練標簽
        num_iteration (int): 迭代次數
    """
    for j in xrange(num_iteration):
        data_index = range(self.data_num)
        for i in xrange(self.data_num):
            # 學習速率
            alpha = 0.01
            rand_index = int(random.uniform(0, len(data_index)))
            error = self.label[rand_index] - sigmoid(sum(self.data[rand_index] * self.weights + self.b))
            self.weights += alpha * error * self.data[rand_index]
            self.b += alpha * error
            del(data_index[rand_index])

效果圖:
logistic

神經網絡

參考的是這篇文章，如果自己英語比較好，還可以查看英文文章，里面有簡單的實現，唯一的缺點就是沒有把原理講明白。關於神經網絡，個人認為確實不是一兩句就能解釋清楚的，尤其是網上的博客，要么只給公式，要么只給圖，看起來都非常的晦澀，建議大家看一下加州理工的一個公開課，有中文字幕，一個小時的課程絕對比自己花一天查文字資料理解的深刻，知道原理之后再來看前面的那篇博客就很輕松啦！

BGD實現

博客里面實現用的是批量梯度下降（batch gradient descent），代碼：

def batch_gradient_descent(self, num_passes=20000):
    """批量梯度下降訓練模型"""
    for i in xrange(0, num_passes):
        # Forward propagation
        z1 = self.data.dot(self.W1) + self.b1
        a1 = np.tanh(z1)
        z2 = a1.dot(self.W2) + self.b2
        exp_scores = np.exp(z2)
        probs = exp_scores / np.sum(exp_scores, axis=1, keepdims=True)

        # Backpropagation
        delta3 = probs

        delta3[range(self.num_examples), self.label] -= 1
        dW2 = (a1.T).dot(delta3)
        db2 = np.sum(delta3, axis=0, keepdims=True)
        delta2 = delta3.dot(self.W2.T) * (1 - np.power(a1, 2))
        dW1 = np.dot(self.data.T, delta2)
        db1 = np.sum(delta2, axis=0)

        # Add regularization terms (b1 and b2 don't have regularization terms)
        dW2 += self.reg_lambda * self.W2
        dW1 += self.reg_lambda * self.W1

        # Gradient descent parameter update
        self.W1 += -self.epsilon * dW1
        self.b1 += -self.epsilon * db1
        self.W2 += -self.epsilon * dW2
        self.b2 += -self.epsilon * db2

效果圖：

注意：強烈懷疑文中的后向傳播公式給錯了，因為和代碼里的delta2 = delta3.dot(self.W2.T) * (1 - np.power(a1, 2))對不上。

SGD實現

考慮到logistic回歸可以用隨機梯度下降，而且公開課里面也說隨機梯度下降效果更好一些，所以在上面的代碼上自己改動了一下，代碼：


def stochastic_gradient_descent(self, num_passes=200):
    """隨機梯度下降訓練模型"""
    for i in xrange(0, num_passes):
        data_index = range(self.num_examples)

        for j in xrange(self.num_examples):
            rand_index = int(np.random.uniform(0, len(data_index)))
            x = np.mat(self.data[rand_index])
            y = self.label[rand_index]

            # Forward propagation
            z1 = x.dot(self.W1) + self.b1
            a1 = np.tanh(z1)
            z2 = a1.dot(self.W2) + self.b2
            exp_scores = np.exp(z2)
            probs = exp_scores / np.sum(exp_scores, axis=1, keepdims=True)

            # Backpropagation
            delta3 = probs
            if y:
                delta3[0, 0] -= 1
            else:
                delta3[0, 1] -= 1
            dW2 = (a1.T).dot(delta3)
            db2 = np.sum(delta3, axis=0, keepdims=True)
            va = delta3.dot(self.W2.T)
            vb = 1 - np.power(a1, 2)
            delta2 = np.mat(np.array(va) * np.array(vb))
            dW1 = x.T.dot(delta2)
            db1 = np.sum(delta2, axis=0)

            # Add regularization terms (b1 and b2 don't have regularization terms)
            dW2 += self.reg_lambda * self.W2
            dW1 += self.reg_lambda * self.W1

            # Gradient descent parameter update
            self.W1 += -self.epsilon * dW1
            self.b1 += -self.epsilon * db1
            self.W2 += -self.epsilon * dW2
            self.b2 += -self.epsilon * db2

            del(data_index[rand_index])

可能是我寫的方式不好，雖然可以得到正確的結果，但是性能上卻比不上BGD，希望大家能指出問題所在，運行效果圖：

其他

SVM我還在看，里面的公式推導能把人繞死，稍晚一點寫好合入，數學不好就是坑啊😭。至於決策樹分類，貝葉斯分類等比較簡單的，沒有數學功底的人實現起來也很容易，就不放進去了。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Keras實現簡單分類神經網絡 tensorflow框架學習（三）—— 兩個簡單的神經網絡示例，回歸與分類實現邏輯回歸-神經網絡卷積神經網絡分類與回歸任務的應用簡介剖析分類、聚類、決策樹、回歸以及神經網絡 (手寫實現)BP神經網絡python實現簡單的線性回歸數據挖掘——回歸分析2——簡單神經網絡的python實現大數據的常用算法（分類、回歸分析、聚類、關聯規則、神經網絡方法、web數據挖掘）大數據的常用算法（分類、回歸分析、聚類、關聯規則、神經網絡方法、web數據挖掘）基於matlab實現BP算法的神經網絡