本文以SPSSAU系統為例,針對線性回歸的常見問題進行匯總說明。
關於線性回歸的分析思路及操作步驟,可閱讀下方鏈接文章:

①問題一:SPSSAU多元線性回歸在哪兒?
【通用方法】--【線性回歸】。
當考察一個自變量對因變量的影響稱為一元線性回歸,多於一個自變量的情況稱為多元線性回歸。

②問題二:控制變量如何放置?
控制變量指可能干擾模型的項,比如年齡,學歷等基礎信息。從軟件角度來看,並沒有“控制變量”這樣的名詞。“控制變量”就是自變量,所以直接放入“自變量X”框中即可。
③問題三:自變量為定類數據如何分析?
如果自變量X為定類數據,一般作為控制變量(可能對模型有干擾因而放入的項)放入模型,但並不對其進行分析。如果一定要分析,此時應該進行虛擬變量(也稱啞變量)。
使用【數據處理】--【生成變量】里的啞變量設置后再放入。

了解啞變量相關理論,可閱讀下方鏈接文章:
④問題四:數據里有多個Y,線性回歸Y只能放一個
線性回歸模型中要求只有一個因變量,一個或多個自變量。
如果是同一個維度的題,因變量超過1個,可以使用SPSSAU【數據處理】--【生成變量】里的平均值功能。將多個Y合並成一個整體,再進行分析。

如果是不同維度的指標可以將因變量一個一個單獨進行分析。或用路徑分析、結構方程模型進行分析。

⑤問題五:線性回歸有效樣本量不足,需要多少樣本量?
有效樣本不足是指分析時,可以進行分析的樣本量低於方法需要的樣本量。解決方法是加大樣本量。一般來說,至少要求樣本量起碼是變量數的5-10倍,結果更具備參考意義。
⑥問題六:相關分析顯示正相關,回歸分析顯示負相關,如何解釋?
相關分析是只簡單考慮兩個變量之間的關系,分析時不考慮其他控制變量的影響。
回歸分析則是綜合所有進入模型的自變量對因變量的結果而成的,在控制了其他進入回歸方程的變量之后得到的影響關系。
所以得出結果不一致也非常正常。當相關分析、線性回歸結果出現以下的矛盾情況:
①回歸分析存在影響關系,但是卻沒有相關關系。此時建議以‘沒有相關關系作為結論’。
②有負向影響關系,但卻是正向相關關系。此時建議以‘有相關關系但沒有回歸影響關系作為結論’。
⑦問題七:回歸結果看標准化還是非標准化?
標准化回歸系數是消除了量綱影響后的回歸系數,可以用來比較各個自變量的“重要性大小”。
如果目的在於預測模型,一般使用非標准化回歸系數。
⑧問題八:線性回歸因變量不在樣本問題中?
有時候由於問卷設計問題,導致直接缺少了Y(沒有設計對應的問卷題項),建議可以考慮將X所有題項概括計算平均值來表示Y。(使用“ 生成變量”的 平均值功能)
如果問卷中並沒有設計出Y對應的題項,沒有其它辦法可以處理。
⑨問題九:逐步回歸與分層回歸、線性回歸的區別,結果不一致怎么解釋?
逐步回歸是多元線性回歸中一種選擇自變量的方法。分別把每一個變量都選入模型中,每次都保留系數顯著水平最高的變量,剔除不顯著的變量,通過多次的選入和剔除最終得到系數的顯著的回歸方程。適合自變量個數較多時使用。
分層回歸本質是線性回歸,區別在於分層回歸可分為多層,主要用於模型的對比。
如果出現逐步回歸、分層回歸與線性回歸結果不一致的情況,主要是用於選入模型的自變量不同導致。逐步回歸會讓系統自動識別出有影響的自變量X,最終得到的模型與線性回歸中,自己分析的結果很可能出現不一致的情況。
最終以哪個結果為准,應結合專業知識和研究目的選擇。比如某個核心研究項很重要,在逐步回歸結果中沒有體現,此時更應選擇其他方法進行研究。
以上就是今天分享的內容,更多干貨內容登錄SPSSAU官網查看。