對於多元線性回歸算法,它對於數據集具有較好的可解釋性,我們可以對比不過特征參數的輸出系數的大小來判斷它對數據的影響權重,進而對其中隱含的參數進行擴展和收集,提高整體訓練數據的准確性。

整體實現代碼如下所示:
#1-1導入相應的基礎數據集模塊
import numpy as np
import matplotlib.pyplot as plt
from sklearn import datasets
d=datasets.load_boston()
print(d.data)
print(d.DESCR)
print(d.feature_names)
print(d.data[:,5])
x=d.data[d.target<50]
y=d.target[d.target<50]
#1-2使用多元線性回歸法對其進行訓練和預測
from sklearn.linear_model import LinearRegression #引入多元線性回歸算法模塊進行相應的訓練
simple2=LinearRegression()
from sklearn.model_selection import train_test_split
x_train,x_test,y_train,y_test=train_test_split(x,y,random_state=666)
simple2.fit(x_train,y_train)
print(simple2.coef_) #輸出多元線性回歸的各項系數
print(simple2.intercept_) #輸出多元線性回歸的常數項的值
y_predict=simple2.predict(x_test)
#1-3利用sklearn里面的merics模塊導出三大評價指標進行評價,直接進行調用計算
from sklearn.metrics import mean_absolute_error
from sklearn.metrics import mean_squared_error
from sklearn.metrics import r2_score #直接調用庫函數進行輸出R2
print(mean_squared_error(y_test,y_predict))
print(mean_absolute_error(y_test,y_predict))
print(r2_score(y_test,y_predict))
print(simple2.score(x_test,y_test))
print(simple2.coef_) #輸出多元回歸算法的各個特征的系數矩陣
print(np.argsort(simple2.coef_)) #輸出多元線性回歸算法各個特征的系數排序,可以知道各個特征的影響度
print(d.feature_names[np.argsort(simple2.coef_)]) #輸出各個特征按照影響系數從小到大的順序
實現結果如下所示:
