20171028機器學習之線性回歸過擬合問題的解決方案

本文轉載自查看原文 2017-10-29 09:03 1696 機器學習

在函數中加入一個正則項：

三種方式：

一、Ridge回歸（嶺回歸）：

　　優點：具有較高的准確性、魯棒性以及穩定性

　　缺點：求解速度慢

二、Lasso回歸：

　　優點：求解速度快（原理降維計算，把數據維度中存在的噪音和冗余去除）

　　缺點：相比Ridge回歸沒有較高的准確性、魯棒性以及穩定性

三、彈性網絡：

　　特點：綜合了以上兩種回歸算法的特性。計算效率以及魯棒性兼備。

幾種回歸解決擬合問題的綜合比較：

GIthub：代碼

https://github.com/chenjunhaolefa/AI/blob/master/MachineLearning/LinearRegression03.py

# coding=utf-8
'''
下面的代碼是用一個小例子解決線性回歸過擬合問題
'''
import numpy as np
import matplotlib as mpl
import matplotlib.pyplot as plt
import pandas as pd
import warnings
import sklearn
from sklearn.linear_model import LinearRegression, LassoCV, RidgeCV, ElasticNetCV
from sklearn.preprocessing import PolynomialFeatures
from sklearn.pipeline import Pipeline
from sklearn.linear_model.coordinate_descent import ConvergenceWarning

#解決畫圖產生的中文亂碼問題
mpl.rcParams['font.sans-serif']=[u'simHei']
mpl.rcParams['axes.unicode_minus']=False

#生成一段數據來測試一下擬合問題
np.random.seed(100)
np.set_printoptions(linewidth=1000, suppress=True)
N = 10
x = np.linspace(0, 6, N) + np.random.randn(N)
y = 1.8*x**3 + x**2 - 14*x - 7 + np.random.randn(N)
x.shape = -1, 1
y.shape = -1, 1

#模型
models = [
    Pipeline([
            ('Poly', PolynomialFeatures()),
            ('Linear', LinearRegression(fit_intercept=False))
        ]),
    Pipeline([
            ('Poly', PolynomialFeatures()),
            ('Linear', RidgeCV(alphas=np.logspace(-3,2,50), fit_intercept=False))
        ]),
    Pipeline([
            ('Poly', PolynomialFeatures()),
            ('Linear', LassoCV(alphas=np.logspace(-3,2,50), fit_intercept=False))
        ]),
    Pipeline([
            ('Poly', PolynomialFeatures()),
            ('Linear', ElasticNetCV(alphas=np.logspace(-3,2,50), l1_ratio=[.1, .5, .7, .9, .95, 1], fit_intercept=False))
        ])
]

plt.figure(facecolor='W')
degree = np.arange (1, N, 2)  # 定義函數的階數  X^2代表2階函數 N表示N階
dm = degree.size
colors = []  # 顏色
for c in np.linspace (16711680, 255, dm):
    colors.append ('#%06x' % c)
titles = [u'線性回歸', u'Ridge回歸', u'Lasso回歸', u'ElasticNet']

for t in range(4):
    model = models[t]
    plt.subplot(2, 2, t + 1)
    plt.plot(x, y, 'ro', ms=5, zorder=N)

    for i, d in enumerate(degree):
        model.set_params(Poly__degree=d)

        model.fit(x, y.ravel())

        lin = model.get_params('Linear')['Linear']

        output = u'%s:%d階，系數為：' % (titles[t], d)
        print output, lin.coef_.ravel()

        x_hat = np.linspace(x.min(), x.max(), num=100)
        x_hat.shape = -1, 1

        y_hat = model.predict(x_hat)

        s = model.score(x, y)

        z = N - 1 if (d == 2) else 0
        label = u'%d階, 正確率=%.3f' % (d, s)
        plt.plot(x_hat, y_hat, color=colors[i], lw=2, alpha=0.75, label=label, zorder=z)

    plt.legend(loc='upper left')
    plt.grid(True)
    plt.title(titles[t])
    plt.xlabel('X', fontsize=16)
    plt.ylabel('Y', fontsize=16)

plt.tight_layout(1, rect=(0, 0, 1, 0.95))
plt.suptitle(u'各種不同線性回歸過擬合顯示', fontsize=22)
plt.show()

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 機器學習之線性回歸【機器學習】回歸分析、過擬合、分類 Python機器學習隨筆之非線性分類的logistic回歸擬合及正則化機器學習中梯度下降法原理及用其解決線性回歸問題的C語言實現機器學習-線性回歸和局部加權線性回歸機器學習-線性回歸（基於R語言）【機器學習】一般線性回歸機器學習：簡單線性回歸機器學習算法實現——線性回歸 7.機器學習之線性回歸算法