Python 回歸分析


#回歸分析和基於模擬的分析
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

from numpy import random
from pandas import Series,DataFrame
from scipy import stats

tips=pd.read_csv('tips.csv')
tips['tips_pct']=tips['tip']/tips['total_bill']

# #可視化分析變量之間的關系,變量類別多,挨個分析麻煩,可以用seaborn
# sns.set()
# sns.pairplot(tips,hue='day')
# plt.show()
# #用day來區分顏色
# sns.pairplot(tips,hue='smoker')
# plt.show()
# #也可以用是否吸煙來區分顏色

'''
1.通過回歸分析,確定變量的關系,即模型
2.理解線性回歸的原理,輸出的含義
3.掌握如何評價和選擇回歸模型
4.掌握基於重抽樣(模擬)的分析方法:置換檢驗和自助法
'''
#做線性回歸
np.random.seed(12345678)
x=np.random.random(10)
y=np.random.random(10)
slope,intercept,r,p,std_err=stats.linregress(x,y)
print(stats.linregress(x,y))
#LinregressResult(slope=0.3448642607472153, intercept=0.2685782352454486, rvalue=0.2835529378070845, pvalue=0.4272394264684026, stderr=0.41235189090280017)
#slope斜率,intercept截距
fig,ax=plt.subplots(1,1,figsize=(8,6))
ax.plot(x,y,'o')
ax.plot(x,intercept+x*slope)
plt.show()

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM