数据处理笔记---非线性回归模型

本文转载自查看原文 2021-06-09 00:13 980 数据处理

　　sklearn实现非线性回归模型的本质是通过线性模型实现非线性模型，如何实现呢？sklearn就是先将非线性模型转换为线性模型，再利用线性模型的算法进行训练模型。

一、线性模型解决非线性模型的思想

1、样本数据如下

x	y
1	45000
2	50000
3	60000
4	80000
5	110000
6	150000
7	200000
8	300000
9	500000
10	1000000

2、假设样本数据符合线性模型 y = a₀ + a₁x，则可以直接利用sklearn的线性回归模型方法训练该模型

3、原理:

假设样本数据符合非线性模型 y = a₀x⁰ + a₁x¹ + a₂x² + a₃x³ ，(其中x⁰=1)那么我们如何将该非线性模型转为线性模型呢？sklearn的解释思路是从样本数据中的自变量下手的，它首先通过计算将样本数据修改为下表
x⁰ x¹ x² x³ y
[[ 1. 1. 1. 1.]
[ 1. 2. 4. 8.]
[ 1. 3. 9. 27.]
[ 1. 4. 16. 64.]
[ 1. 5. 25. 125.]
[ 1. 6. 36. 216.]
[ 1. 7. 49. 343.]
[ 1. 8. 64. 512.]
[ 1. 9. 81. 729.]
[ 1. 10. 100. 1000.]]
4、根据上面的样本数据，也就把 y = a₀x⁰ + a₁x¹ + a₂x² + a₃x³ ^非线性回归模型转换为了y = a₀x₀ + a₀₁x₁ + a₂x₂ + a₃x₃的线性回归模型了，这样就可以利用sklearn的线性回归模型算法进行训练非线性回归模型了

二、具体实现代码如下

 1 import numpy as np
 2 import matplotlib.pyplot as plt
 3 from sklearn.preprocessing import PolynomialFeatures
 4 from sklearn.linear_model import LinearRegression
 5 
 6 # 读取数据
 7 data = np.genfromtxt('job.csv', delimiter=',')
 8 x_data = data[1:, 1]
 9 y_data = data[1:, 2]
10 
11 # 一维数据通过增加维度转为二维数据
12 x_2data = x_data[:, np.newaxis]
13 y_2data = data[1:, 2, np.newaxis]
14 
15 # 训练一元线性模型
16 model = LinearRegression()
17 model.fit(x_2data, y_2data)
18 
19 plt.plot(x_2data, y_2data, 'b.')
20 plt.plot(x_2data, model.predict(x_2data), 'r')
21 
22 # 定义多项式回归：其本质是将变量x，根据degree的值转换为相应的多项式（非线性回归），eg: degree=3,则回归模型
23 # 变为 y = theta0 + theta1 * x + theta2 * x^2 + theta3 * x^3
24 poly_reg = PolynomialFeatures(degree=3)
25 # 特征处理
26 x_ploy = poly_reg.fit_transform(x_2data)  # 这个方法实质是把非线性的模型转为线性模型进行处理，
27 # 处理方法就是把多项式每项的样本数据根据幂次数计算出相应的样本值
29 # 训练线性模型（其本质是非线性模型，是由非线性模型转换而来）
30 lin_reg_model = LinearRegression()
31 lin_reg_model.fit(x_ploy, y_2data)
32 
33 plt.plot(x_2data, y_2data, 'b.')
34 plt.plot(x_2data, lin_reg_model.predict(x_ploy), 'r')
35 
36 plt.show()

　　实现参考自博客https://blog.csdn.net/qq_34720818/article/details/103349452

三、实现结果

免责声明！

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 tensorflow非线性回归（03-1） R语言用nls做非线性回归以及函数模型的参数估计第十二篇：深入学习高级非线性回归算法 --- 树回归系列算法 TensorFlow.NET机器学习入门【3】采用神经网络实现非线性回归线性模型之一：线性回归的原理《机器学习(周志华)》笔记--线性模型（2）--线性回归训练流程、线性回归的正规方程解、LinearRegression模型、线性回归方法用于波士顿房价预测 TensorFlow学习笔记（五）图像数据处理 InVEST模型生境质量模型数据处理流程机器学习中线性模型和非线性的区别 RFM模型数据处理结果分析（回答网友的问题）