實驗目的:
1、學會使用SPSS的簡單操作。
2、掌握回歸分析。
實驗內容:
1.相關分析。線性回歸相關關系指一一對應的確定關系。設有兩個變量 x 和 y ,變量 y 隨變量 x 一起變化,並完全依賴於 x ,當變量 x 取某個數值時, y 依確定的關系取相應的值,則稱 y 是 x 的函數,記為 y = f (x),其中 x 稱為自變量,y 稱為因變量。且各觀測點落在一條線上 。
2.回歸分析,重點考察考察一個特定的變量(因變量),而把其他變量(自變量)看作是影響這一變量的因素,並通過適當的數學模型將變量間的關系表達出來利用樣本數據建立模型的估計方程對模型進行顯著性檢驗進而通過一個或幾個自變量的取值來估計或預測因變量的取值。
3.逐步回歸,將向前選擇和向后剔除兩種方法結合起來篩選自變量。在增加了一個自變量后,它會對模型中所有的變量進行考察,看看有沒有可能剔除某個自變量。如果在增加了一個自變量后,前面增加的某個自變量對模型的貢獻變得不顯著,這個變量就會被剔除。按照方法不停地增加變量並考慮剔除以前增加的變量的可能性,直至增加變量已經不能導致SSE顯著減少在前面步驟中增加的自變量在后面的步驟中有可能被剔除,而在前面步驟中剔除的自變量在后面的步驟中也可能重新進入到模型中。
4.啞變量回歸,也稱虛擬變量。用數字代碼表示的定性自變量。啞變量可有不同的水平。啞變量的取值為0,1。
實驗步驟:
- 相關分析SPSS操作,【分析】→【相關-雙變量】,將各變量選入【變量】。

1 CORRELATIONS 2 /VARIABLES=銷售收入 廣告費用 3 /PRINT=TWOTAIL NOSIG 4 /MISSING=PAIRWISE.
2.回歸分析SPSS操作,【分析】→【回歸-線性】,將因變量選入【因變量】,將自變量選入【自變量】。需要預測時,【保存】→【預測值】,選中【未標准化】→【預測區間】,選中【均值】→【單值】→【置信區間】,選擇置信水平。需要分析殘差時,【保存】→【殘差】,選中【未標准化】,選中標准化。需要輸出標准殘差的直方圖和正態概率圖時,【繪圖】→【標准化殘差圖】,選中【直方圖】,選中【正態概率圖】。

1 REGRESSION 2 /MISSING LISTWISE 3 /STATISTICS COEFF OUTS R ANOVA 4 /CRITERIA=PIN(.05) POUT(.10) CIN(95) 5 /NOORIGIN 6 /DEPENDENT 銷售收入 7 /METHOD=ENTER 廣告費用 8 /SAVE PRED MCIN ICIN.

1 REGRESSION 2 /MISSING LISTWISE 3 /STATISTICS COEFF OUTS R ANOVA 4 /CRITERIA=PIN(.05) POUT(.10) CIN(95) 5 /NOORIGIN 6 /DEPENDENT 銷售收入 7 /METHOD=ENTER 廣告費用 8 /SAVE MCIN RESID ZRESID.

1 REGRESSION 2 /MISSING LISTWISE 3 /STATISTICS COEFF OUTS R ANOVA 4 /CRITERIA=PIN(.05) POUT(.10) 5 /NOORIGIN 6 /DEPENDENT 銷售收入 7 /METHOD=ENTER 廣告費用 8 /RESIDUALS HISTOGRAM(ZRESID) NORMPROB(ZRESID).
3.逐步回歸SPSS操作,【分析】→【回歸-線性】,將因變量選入【因變量】,將自變量選入【自變量】,【方法】→【步進】,【選項】→【步進方法標准】,選中【使用F的概率】,【進入】輸入增加變量顯著度,【刪除】輸入剔除變量的顯著度,【繼續】。需要預測時,【保存】→【預測值】,選中【均值】【單值】【置信區間】,選擇置信水平。需要分析殘差時,【保存】→【殘差】,選中【未標准化】,選中【標准化】。
輸入/除去的變量a |
|||
模型 |
輸入的變量 |
除去的變量 |
方法 |
1 |
累計應收貸款 |
. |
步進(條件:要輸入的 F 的概率 <= .050,要除去的 F 的概率 >= .100)。 |
2 |
貸款項目個數 |
. |
步進(條件:要輸入的 F 的概率 <= .050,要除去的 F 的概率 >= .100)。 |
a. 因變量:不良貸款 |
模型摘要 |
||||
模型 |
R |
R 方 |
調整后 R 方 |
標准估算的錯誤 |
1 |
.732a |
.535 |
.515 |
2.5139 |
2 |
.805b |
.648 |
.615 |
2.2381 |
a. 預測變量:(常量), 累計應收貸款 |
||||
b. 預測變量:(常量), 累計應收貸款, 貸款項目個數 |
ANOVAa |
||||||
模型 |
平方和 |
自由度 |
均方 |
F |
顯著性 |
|
1 |
回歸 |
167.299 |
1 |
167.299 |
26.473 |
.000b |
殘差 |
145.351 |
23 |
6.320 |
|
|
|
總計 |
312.650 |
24 |
|
|
|
|
2 |
回歸 |
202.450 |
2 |
101.225 |
20.208 |
.000c |
殘差 |
110.200 |
22 |
5.009 |
|
|
|
總計 |
312.650 |
24 |
|
|
|
|
a. 因變量:不良貸款 |
||||||
b. 預測變量:(常量), 累計應收貸款 |
||||||
c. 預測變量:(常量), 累計應收貸款, 貸款項目個數 |

1 REGRESSION 2 /MISSING LISTWISE 3 /STATISTICS COEFF OUTS R ANOVA 4 /CRITERIA=PIN(.05) POUT(.10) 5 /NOORIGIN 6 /DEPENDENT 不良貸款 7 /METHOD=STEPWISE 累計應收貸款 貸款項目個數 固定資產投資.

1 REGRESSION 2 /MISSING LISTWISE 3 /STATISTICS COEFF OUTS R ANOVA 4 /CRITERIA=PIN(.05) POUT(.10) CIN(95) 5 /NOORIGIN 6 /DEPENDENT 不良貸款 7 /METHOD=STEPWISE 累計應收貸款 貸款項目個數 固定資產投資 8 /SAVE PRED MCIN ICIN.

1 REGRESSION 2 /MISSING LISTWISE 3 /STATISTICS COEFF OUTS R ANOVA 4 /CRITERIA=PIN(.05) POUT(.10) CIN(95) 5 /NOORIGIN 6 /DEPENDENT 不良貸款 7 /METHOD=STEPWISE 累計應收貸款 貸款項目個數 固定資產投資 8 /SAVE MCIN RESID ZRESID.
4.啞變量分析SPSS操作:【分析】→【一般線性模型】→【單變量】,將因變量選入【因變量】,將啞變量選入【固定因子】,將數字變量選入【協變量】,【模型】→【構建項】→【單變量】,將啞變量選入【模型】,將數字自變量選入【模型】,【構建項】→【主效應】→【繼續】→【選項】→【顯示】→【參數估計值】。

1 UNIANOVA 月工資收入 BY 性別 WITH 工作年限 2 /METHOD=SSTYPE(3) 3 /INTERCEPT=INCLUDE 4 /PRINT PARAMETER 5 /CRITERIA=ALPHA(.05) 6 /DESIGN=工作年限 性別.
小結:
線性分析和回歸具有密切的聯系,多重線性回歸模型可以使用向前法、向后法、逐步法等多種回歸分析方法來協助進行變量篩選,但是自動篩選不能完全替代人工篩選。回歸模型有着自己嚴格的適用條件,在擬合需要不斷進行這些適用條件的判斷。標准的回歸模型步驟應當包括如下內容:作出散點圖,觀察變量間的趨勢;考察數據的分布,進行必要的預處理;進行直線回歸線性,建立基本模型;進行殘差分析;進行強影響點的診斷及多重共線問題到判斷。下一步應當做就是結合專業實際,將分析結果運用到現實中,來看看結果有無實用價值,以及是否存在應用中的其他問題。