【轉】梯度下降算法以及其Python實現


一、梯度下降算法理論知識

我們給出一組房子面積,卧室數目以及對應房價數據,如何從數據中找到房價y與面積x1和卧室數目x2的關系?


 

為了實現監督學習,我們選擇采用自變量x1、x2的線性函數來評估因變量y值,得到:


 

這里,sita1、sita2代表自變量x1、x2的權重(weights),sita0代表偏移量。為了方便,我們將評估值寫作h(x),令x0=1,則h(x)可以寫作:


 

其中n為輸入樣本數的數量。為了得到weights的值,我們需要令我們目前的樣本數據評估出的h(x)盡可能的接近真實y值。我們定義誤差函數(cost function)來表示h(x)和y值相接近的程度:


 

這里的系數1/2是為了后面求解偏導數時可以與系數相互抵消。我們的目的是要誤差函數盡可能的小,即求解weights使誤差函數盡可能小。首先,我們隨機初始化weigths,然后不斷反復的更新weights使得誤差函數減小,直到滿足要求時停止。這里更新算法我們選擇梯度下降算法,利用初始化的weights並且反復更新weights:


 

這里a代表學習率,表示每次向着J最陡峭的方向邁步的大小。為了更新weights,我們需要求出函數J的偏導數。首先計算只有一個數據樣本(x,y)時,如何計算J的偏導數:


 

對於只含有一組數據的訓練樣本,我們可以得到更新weights的規則為:


 

擴展到多組數據樣本,更新公式為:


 

稱為批處理梯度下降算法,這種更新算法所需要的運算成本很高,尤其是數據量較大時。考慮下面的更新算法:


 

該算法又叫做隨機梯度下降法,這種算法不停的更新weights,每次使用一個樣本數據進行更新。當數據量較大時,一般使用后者算法進行更新。

二、梯度下降Python實現

自己創建了一組數據,存為csv格式,如下圖所示:


 

待訓練數據A、B為自變量,C為因變量。
在寫程序之前,要先導入我們需要的模塊。

import numpy as np
from numpy import genfromtxt

 

首先將數據讀入Python中,程序如下所示:

dataPath = r"E:\learning\house.csv"
dataSet = genfromtxt(dataPath, delimiter=',')

 

接下來將讀取的數據分別得到自變量矩陣和因變量矩陣:

def getData(dataSet):
    m, n = np.shape(dataSet)
    trainData = np.ones((m, n))
    trainData[:,:-1] = dataSet[:,:-1]
    trainLabel = dataSet[:,-1]
    return trainData, trainLabel

 

這里需要注意的是,在原有自變量的基礎上,需要主觀添加一個均為1的偏移量,即公式中的x0。原始數據的前n-1列再加上添加的偏移量組成自變量trainData,最后一列為因變量trainLabel。
下面開始實現批處理梯度下降算法:

def getData(dataSet):
    m, n = np.shape(dataSet)
    trainData = np.ones((m, n))
    trainData[:,:-1] = dataSet[:,:-1]
    trainLabel = dataSet[:,-1]
    return trainData, trainLabel

 

x為自變量訓練集,y為自變量對應的因變量訓練集;theta為待求解的權重值,需要事先進行初始化;alpha是學習率;m為樣本總數;maxIterations為最大迭代次數;
求解權重過程,初始化batchGradientDescent函數需要的各個參數:

trainData, trainLabel = getData(dataSet)
m, n = np.shape(trainData)
theta = np.ones(n)
alpha = 0.05
maxIteration = 1000

 

alpha和maxIterations可以更改,之后帶入到batchGradientDescent中可以求出最終權重值。

theta = batchGradientDescent(trainData, trainLabel, theta, alpha, m, maxIteration)

 

之后我們給出一組數據,需要進行預測,預測函數:

def predict(x, theta):
    m, n = np.shape(x)
    xTest = np.ones((m, n+1))
    xTest[:, :-1] = x
    yPre = np.dot(xTest, theta)
    return yPre

 

x為待預測值的自變量,thta為已經求解出的權重值,yPre為預測結果
我們給出測試集


 

對該組數據進行預測,程序如下:

x = np.array([[3.1, 5.5], [3.3, 5.9], [3.5, 6.3], [3.7, 6.7], [3.9, 7.1]])
print predict(x, theta)

 

輸出結果如下:

[9.49608552  10.19523475  10.89438398  11.59353321  12.29268244]

 

我們可以更改學習率和迭代次數進行預測結果的對比:
更改學習率由0.05變為0.1時,結果為:

[ 9.49997917  10.19997464  10.89997012  11.59996559  12.29996106]

 

發現預測結果要由於學習率為0.05時,這說明學習率0.05選擇的偏小,即每一次邁步偏小。
固定學習率為0.05,更改迭代次數為5000時,結果為:

[ 9.5  10.2  10.9  11.6  12.3]

 

這正是我們想要的預測結果,這說明有限循環次數內,循環次數越多,越接近真實值。但是也不能無限循環下去,需要尋找一個度。
一般達到以下的任意一種情況即可以停止循環:
1.權重的更新低於某個閾值;
2.預測的錯誤率低於某個閾值;
3.達到預設的最大循環次數;
其中達到任意一種,就停止算法的迭代循環,得出最終結果。
完整的程序如下:

#coding=utf-8

import numpy as np
import random
from numpy import genfromtxt

def getData(dataSet):
    m, n = np.shape(dataSet)
    trainData = np.ones((m, n))
    trainData[:,:-1] = dataSet[:,:-1]
    trainLabel = dataSet[:,-1]
    return trainData, trainLabel

def batchGradientDescent(x, y, theta, alpha, m, maxIterations):
    xTrains = x.transpose()
    for i in range(0, maxIterations):
        hypothesis = np.dot(x, theta)
        loss = hypothesis - y
        # print loss
        gradient = np.dot(xTrains, loss) / m
        theta = theta - alpha * gradient
    return theta

def predict(x, theta):
    m, n = np.shape(x)
    xTest = np.ones((m, n+1))
    xTest[:, :-1] = x
    yP = np.dot(xTest, theta)
    return yP

dataPath = r"E:\learning\house.csv"
dataSet = genfromtxt(dataPath, delimiter=',')
trainData, trainLabel = getData(dataSet)
m, n = np.shape(trainData)
theta = np.ones(n)
alpha = 0.1
maxIteration = 5000
theta = batchGradientDescent(trainData, trainLabel, theta, alpha, m, maxIteration)
x = np.array([[3.1, 5.5], [3.3, 5.9], [3.5, 6.3], [3.7, 6.7], [3.9, 7.1]])
print predict(x, theta)

 

我是一個機器學習的小白,剛剛開始接觸,從最基本的也是很重要的梯度下降開始學習。這篇文章是我對梯度下降的理解,還有很多不完善的地方,我只給出了批量梯度下降算法的python實現,隨機梯度下降還需要我進一步編寫,而且關於循環停止,本文只是最簡單的循環次數停止,等等,還有很多問題,以后會繼續更近並改進該文章。寫下來就是為了隨時隨地翻出來看看,鞏固知識,並不斷改進。

原文鏈接:梯度下降算法以及其Python實現


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM