線性回歸
(1)線性回歸的主要內容:
有興趣可以玩一下這個游戲:是猜相關系數的,給你一些散點圖,猜相關系數,很難猜對,說明看圖說明相關性不靠譜!
(2)線性回歸怎么做?數學公式
一個簡單線性回歸的例子:
ols:
擬合優度:
(3) 假設檢驗
線性回歸這位老師用的是statsmodels做的。
這就是用線性回歸擬合出來的模型!
使用這個函數可以直接得到模型的一些結果,會得到這些表!
這個是預測的函數:predict(x)。這是這個包的函數!
二、多元線性回歸
也可以用向量的方式。
參數是迭代計算的,此處不講了。
模型的檢驗
只用與 模型的選擇 調整的r方。避免的樣本量的影響,預防過擬合!
python中的實現 試用stats model 多個變量用+連一起!
模型的一些值
變量的篩選,除了常規的,就是使用相前,向后還有逐步,還有全子集的方法。
不多介紹,上篇也講過。
python需要自己寫來實現,當然我不會,這里可以用spss去實現
這是python代碼
跳過。。。
回歸的假設。
線性
強影響點篩選,然后直接刪除
強烈建議用spss進行多元線性回歸建模。不過為了熟悉python明天打算用python更着去實現。
自己整理一下,多元線性回歸的檢驗方法:
整體顯著性檢驗:回歸模型出來時候,可以之間看整體的F檢驗的p值
擬合優度檢驗:最簡單的就看R方和調整的R方
系數檢驗:T檢驗結果,可以直接看P值
自相關檢驗:dw檢驗用得最多
異方差檢驗:Goldfeld - Quandt 檢驗法,這個方法挺好的的。其實還有其他檢驗方法,解決辦法是建議取對數
共線性檢驗:vif值
不夠細,明日具體操作的時候會細點!