回歸分析(一元線性回歸分析、多元線性回歸分析、非線性回歸分析、曲線估計、時間序列的曲線估計、含虛擬自變量的回歸分析以及邏輯回歸分析)
回歸分析中,一般首先繪制自變量和因變量間的散點圖,然后通過數據在散點圖中的分布特點選擇所要進行回歸分析的類型,是使用線性回歸分析還是某種非線性的回歸分析。
回歸分析與相關分析對比:
在回歸分析中,變量y稱為因變量,處於被解釋的特殊地位;;而在相關分析中,變量y與變量x處於平等的地位。
在回歸分析中,因變量y是隨機變量,自變量x可以是隨機變量,也可以 是非隨機的確定變量;而在相關分析中,變量x和變量y都是隨機變量。
相關分析是測定變量之間的關系密切程度,所使用的工具是相關系數; 而回歸分析則是側重於考察變量之間的數量變化規律。
統計檢驗概念:
為了確定從樣本(sample)統計結果推論至總體時所犯錯的概率。
F值和t值就是這些統計檢定值,與它們相對應的概率分布,就是F分布和t分布。統計顯著性(sig)就是出現目前樣本這結果的機率。
標准差表示數據的離散程度,標准誤表示抽樣誤差的大小。
統計檢驗的分類:
擬合優度檢驗:檢驗樣本數據聚集在樣本回歸直線周圍的密集程度,從而判斷回歸方程對樣本數據的代表程度。 回歸方程的擬合優度檢驗一般用判定系數R2實現。
回歸方程的顯著性檢驗(F檢驗):是對因變量與所有自變量之間的線性關系是否顯著的一種假設檢驗。 回歸方程的顯著性檢驗一般采用F檢驗。
回歸系數的顯著性檢驗(t檢驗): 根據樣本估計的結果對總體回歸系數的有關假設進行檢驗。
1.一元線性回歸分析
定義:在排除其他影響因素或假定其他影響因素確定的條件下,分析某一個因素(自變量)是如何影響另一事物(因變量)的過程。
SPSS操作
2.多元線性回歸分析
定義:研究在線性相關條件下,兩個或兩個以上自變量對一個因變量的數量變化關系。
表現這一數量關系的數學公式,稱為多元線性回歸模型。
SPSS操作
3.非線性回歸分析
定義:研究在非線性相關條件下,自變量對因變量的數量變化關系
非線性回歸問題大多數可以化為線性回歸問題來求解,也就是通過對非線性 回歸模型進行適當的變量變換,使其化為線性模型來求解。
常見的非線性回歸模型:雙曲線模型、冪函數模型、指數函數模型、對數函數模型、多項式模型
4.曲線估計
曲線估計的方法:首先根據實際問題本身特點,同時選擇幾種模型;
然后SPSS自動完成模型的參數估計,並顯示R2、F檢驗值、相伴概率值等統計量;
最后,選擇具有R2統計量值最大的模型作為此問題的回歸模型,並作一些預測。
SPSS操作
5.時間序列的曲線估計
定義:把時間設為自變量x,代表具體的經濟或社會現象的變量設為因變量y, 研究變量x與y之間關系的方法
SPSS操作
6.含虛擬自變量的回歸分析
考慮定性變量且回歸模型的參數不再是固定不變的
如果在回歸模型中需要引入多個0-1型虛擬變量D時,虛擬變量的個數應按下 列原則來確定:對於包含一個具有k種特征或狀態的質因素的回歸模型,如果回歸模型不帶常數項,則中需引入k個0-1型虛擬變量D;如果有常數項,則只需引入 k-1個0-1型虛擬變量D。當k=2時,只需要引入一個0-1型虛擬變量D。
SPSS操作
7.邏輯回歸分析
定義:邏輯回歸分析是對定性變量的回歸分析
處理定性因變量的統計分析方法有:判別分析(Discriminant analysis)、Probit分析、Logistic回歸分析和對數線性模型等。
Logistic回歸分析根據因變量取值類別不同,又可以分為Binary Logistic回歸分析和Multinominal Logistic回歸分析。Binary Logistic回歸模型中因變量只能取兩個值1和0(虛擬因變量),而 Multinomial Logistic回歸模型中因變量可以取多個值。
常用的檢驗統計量:對數似然值、 偽R2、Wald統計量
SPSS操作