任何事物和人都不是以個體存在的,它們都被復雜的關系鏈所圍繞着,具有一定的相關性,也會具備一定的因果關系,(比如:父母和子女,不僅具備相關性,而且還具備因果關系,因為有了父親和母親,才有了兒子或女兒),但不是所有相關聯的事物都具備因果關系。
下面用SPSS采用回歸—線性分析的方式來分析一下:居民總儲蓄 和 “居民總消費”情況是否具備相關性,如果具備相關性,那相關關系的密切程度為多少。
下面以“居民總儲蓄”和“居民總消費”的調查樣本做統計分析,數據如下所示:
第一步:我們先來分析“居民總儲蓄”和“居民總消費”是否具備相關性 (采用SPSS 19版本)
1:點擊“分析”—相關—雙變量, 進入如下界面:
將“居民總儲蓄”和“居民總消費”兩個變量移入“變量”框內,在“相關系數”欄目中選擇“Pearson",(Pearson是一種簡單相關系數分析和計算的方法,如果需要進行進一步分析,需要借助“多遠線性回歸”分析)在“顯著性檢驗”中選擇“雙側檢驗”並且勾選“標記顯著性相關”點擊確定, 得到如下結果:
從以上結果,可以看出“Pearson"的相關性為0.821,(可以認為是“兩者的相關系數為0.821)屬於“正相關關系”同時“顯著性(雙側) 結果為0.000, 由於0.000<0.01,所以具備顯著性,得出:“居民總儲蓄”和“居民總消費”具備相關性,有關聯。
既然具備相關性,那么我們將進一步做分析, 建立回歸分析,並且構建“一元線性方程”,如下所示:
點擊“分析”--回歸----線性” 結果如下所示:
將“因變量”和“自變量”分別拖入框內 (如上圖所示)從上圖可以看出:“自變量”指 “居民總儲蓄” , "因變量”是指“居民總消費”
點擊“統計量”進入如下界面:
在“回歸系數”中選擇“估計” 在右邊選擇“模型擬合度” 在殘差下面選擇“Durbin-watson(u), 點擊繼續按鈕
再點擊“繪制圖”在“標准化殘差圖”下面選擇“正太概率分布圖”選項
再點擊“保存”按鈕,在殘差下面選擇“未標准化”(數據的標准化,方法有很多,這里不介紹啦)
得到如下結果:
結果分析如下:
1:從模型匯總b 中可以看出“模型擬合度”為0.675,調整后的“模型擬合度”為0.652,就說明“居民總消費”的情況都可以用該模型解釋,擬合度相對較高
2:從anvoa b的檢驗結果來看 (其實這是一個“回歸模型的方差分析表)F的統計量為:29.057,P值顯示為0.000,拒絕模型整體不顯著的假設,證明模型整體是顯著的
3:從“系數a”這個表可以看出“回歸系數,回歸系數的標准差,回歸系數的T顯著性檢驗 等,回歸系數常量為:2878.518,但是SIG為:0.452,常數項不顯著,回歸系數為:0.954,相對的sig為:0.000,具備顯著性,由於在“anvoa b”表中提到了模型整體是“顯著”的
所以一元線性方程為:居民總消費=2878.518+0.954*居民總儲蓄
其中在“樣本數據統計”中,隨即誤差 一般叫“殘差” :
從結果分析來看,可以簡單的認為:居民總儲蓄每增加1億,那居民總消費將會增加0.954億
提示:對於回歸參數的估計,一般采用的是“最小二乘估計法”原則即為:“殘差平方和最小“