線性回歸常見問題匯總,你想知道的都在這里


本文以SPSSAU系統為例,針對線性回歸的常見問題進行匯總說明。

關於線性回歸的分析思路及操作步驟,可閱讀下方鏈接文章:

SPSSAU:線性回歸分析思路總結!簡單易懂又全面!​

 


 

 

①問題一:SPSSAU多元線性回歸在哪兒?

【通用方法】--【線性回歸】。

當考察一個自變量對因變量的影響稱為一元線性回歸,多於一個自變量的情況稱為多元線性回歸。


 

②問題二:控制變量如何放置?

控制變量指可能干擾模型的項,比如年齡,學歷等基礎信息。從軟件角度來看,並沒有“控制變量”這樣的名詞。“控制變量”就是自變量,所以直接放入“自變量X”框中即可。

 

③問題三:自變量為定類數據如何分析?

如果自變量X為定類數據,一般作為控制變量(可能對模型有干擾因而放入的項)放入模型,但並不對其進行分析。如果一定要分析,此時應該進行虛擬變量(也稱啞變量)。

使用【數據處理】--【生成變量】里的啞變量設置后再放入。

 


【生成變量】--【虛擬變量】  

 

了解啞變量相關理論,可閱讀下方鏈接文章:

SPSSAU:什么是虛擬變量?怎么設置才正確?​

 

④問題四:數據里有多個Y,線性回歸Y只能放一個

線性回歸模型中要求只有一個因變量,一個或多個自變量。

如果是同一個維度的題,因變量超過1個,可以使用SPSSAU【數據處理】--【生成變量】里的平均值功能。將多個Y合並成一個整體,再進行分析。

 


【生成變量】--【平均值】  

 

如果是不同維度的指標可以將因變量一個一個單獨進行分析。或用路徑分析、結構方程模型進行分析。


 

 

⑤問題五:線性回歸有效樣本量不足,需要多少樣本量?

有效樣本不足是指分析時,可以進行分析的樣本量低於方法需要的樣本量。解決方法是加大樣本量。一般來說,至少要求樣本量起碼是變量數的5-10倍,結果更具備參考意義。

 

⑥問題六:相關分析顯示正相關,回歸分析顯示負相關,如何解釋?

相關分析是只簡單考慮兩個變量之間的關系,分析時不考慮其他控制變量的影響。

回歸分析則是綜合所有進入模型的自變量對因變量的結果而成的,在控制了其他進入回歸方程的變量之后得到的影響關系。

所以得出結果不一致也非常正常。當相關分析、線性回歸結果出現以下的矛盾情況:

①回歸分析存在影響關系,但是卻沒有相關關系。此時建議以‘沒有相關關系作為結論’。

②有負向影響關系,但卻是正向相關關系。此時建議以‘有相關關系但沒有回歸影響關系作為結論’。

 

⑦問題七:回歸結果看標准化還是非標准化?

標准化回歸系數是消除了量綱影響后的回歸系數,可以用來比較各個自變量的“重要性大小”。

如果目的在於預測模型,一般使用非標准化回歸系數。

 

⑧問題八:線性回歸因變量不在樣本問題中?

有時候由於問卷設計問題,導致直接缺少了Y(沒有設計對應的問卷題項),建議可以考慮將X所有題項概括計算平均值來表示Y。(使用“ 生成變量”的 平均值功能)

如果問卷中並沒有設計出Y對應的題項,沒有其它辦法可以處理。

 

⑨問題九:逐步回歸與分層回歸、線性回歸的區別,結果不一致怎么解釋?

逐步回歸是多元線性回歸中一種選擇自變量的方法。分別把每一個變量都選入模型中,每次都保留系數顯著水平最高的變量,剔除不顯著的變量,通過多次的選入和剔除最終得到系數的顯著的回歸方程。適合自變量個數較多時使用。

分層回歸本質是線性回歸,區別在於分層回歸可分為多層,主要用於模型的對比。

如果出現逐步回歸、分層回歸與線性回歸結果不一致的情況,主要是用於選入模型的自變量不同導致。逐步回歸會讓系統自動識別出有影響的自變量X,最終得到的模型與線性回歸中,自己分析的結果很可能出現不一致的情況。

最終以哪個結果為准,應結合專業知識和研究目的選擇。比如某個核心研究項很重要,在逐步回歸結果中沒有體現,此時更應選擇其他方法進行研究。

 

以上就是今天分享的內容,更多干貨內容登錄SPSSAU官網查看。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM