python數據分析之線性回歸,各種檢驗和解決方法!


線性回歸

(1)線性回歸的主要內容:

有興趣可以玩一下這個游戲:是猜相關系數的,給你一些散點圖,猜相關系數,很難猜對,說明看圖說明相關性不靠譜!

(2)線性回歸怎么做?數學公式

一個簡單線性回歸的例子:

ols:

 

 

 

擬合優度:

(3) 假設檢驗

 

線性回歸這位老師用的是statsmodels做的。

這就是用線性回歸擬合出來的模型!

使用這個函數可以直接得到模型的一些結果,會得到這些表!

這個是預測的函數:predict(x)。這是這個包的函數!

 

二、多元線性回歸

也可以用向量的方式。

參數是迭代計算的,此處不講了。

模型的檢驗

只用與 模型的選擇 調整的r方。避免的樣本量的影響,預防過擬合!

python中的實現 試用stats model 多個變量用+連一起!

模型的一些值

變量的篩選,除了常規的,就是使用相前,向后還有逐步,還有全子集的方法。

不多介紹,上篇也講過。

python需要自己寫來實現,當然我不會,這里可以用spss去實現

這是python代碼

 

 

跳過。。。

回歸的假設。

線性

強影響點篩選,然后直接刪除

 

 

 

 

強烈建議用spss進行多元線性回歸建模。不過為了熟悉python明天打算用python更着去實現。

自己整理一下,多元線性回歸的檢驗方法:

整體顯著性檢驗:回歸模型出來時候,可以之間看整體的F檢驗的p值

擬合優度檢驗:最簡單的就看R方和調整的R方

系數檢驗:T檢驗結果,可以直接看P值

自相關檢驗:dw檢驗用得最多

異方差檢驗:Goldfeld - Quandt 檢驗法,這個方法挺好的的。其實還有其他檢驗方法,解決辦法是建議取對數

共線性檢驗:vif值

 

 不夠細,明日具體操作的時候會細點!

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM