線性回歸常見問題匯總，你想知道的都在這里

本文轉載自查看原文 2020-06-09 11:11 2282 SPSSAU/ 回歸分析/ 數據分析/ 分析思路

本文以SPSSAU系統為例，針對線性回歸的常見問題進行匯總說明。

關於線性回歸的分析思路及操作步驟，可閱讀下方鏈接文章：

①問題一：SPSSAU多元線性回歸在哪兒？

【通用方法】--【線性回歸】。

當考察一個自變量對因變量的影響稱為一元線性回歸，多於一個自變量的情況稱為多元線性回歸。

②問題二：控制變量如何放置？

控制變量指可能干擾模型的項，比如年齡，學歷等基礎信息。從軟件角度來看，並沒有“控制變量”這樣的名詞。“控制變量”就是自變量，所以直接放入“自變量X”框中即可。

③問題三：自變量為定類數據如何分析？

如果自變量X為定類數據，一般作為控制變量(可能對模型有干擾因而放入的項)放入模型，但並不對其進行分析。如果一定要分析，此時應該進行虛擬變量（也稱啞變量）。

使用【數據處理】--【生成變量】里的啞變量設置后再放入。

【生成變量】--【虛擬變量】

了解啞變量相關理論，可閱讀下方鏈接文章：

④問題四：數據里有多個Y，線性回歸Y只能放一個

線性回歸模型中要求只有一個因變量，一個或多個自變量。

如果是同一個維度的題，因變量超過1個，可以使用SPSSAU【數據處理】--【生成變量】里的平均值功能。將多個Y合並成一個整體，再進行分析。

【生成變量】--【平均值】

如果是不同維度的指標可以將因變量一個一個單獨進行分析。或用路徑分析、結構方程模型進行分析。

⑤問題五：線性回歸有效樣本量不足，需要多少樣本量？

有效樣本不足是指分析時,可以進行分析的樣本量低於方法需要的樣本量。解決方法是加大樣本量。一般來說，至少要求樣本量起碼是變量數的5-10倍，結果更具備參考意義。

⑥問題六：相關分析顯示正相關，回歸分析顯示負相關，如何解釋？

相關分析是只簡單考慮兩個變量之間的關系，分析時不考慮其他控制變量的影響。

回歸分析則是綜合所有進入模型的自變量對因變量的結果而成的，在控制了其他進入回歸方程的變量之后得到的影響關系。

所以得出結果不一致也非常正常。當相關分析、線性回歸結果出現以下的矛盾情況：

①回歸分析存在影響關系，但是卻沒有相關關系。此時建議以‘沒有相關關系作為結論’。

②有負向影響關系，但卻是正向相關關系。此時建議以‘有相關關系但沒有回歸影響關系作為結論’。

⑦問題七：回歸結果看標准化還是非標准化？

標准化回歸系數是消除了量綱影響后的回歸系數，可以用來比較各個自變量的“重要性大小”。

如果目的在於預測模型，一般使用非標准化回歸系數。

⑧問題八：線性回歸因變量不在樣本問題中？

有時候由於問卷設計問題，導致直接缺少了Y(沒有設計對應的問卷題項)，建議可以考慮將X所有題項概括計算平均值來表示Y。（使用“ 生成變量”的平均值功能）

如果問卷中並沒有設計出Y對應的題項，沒有其它辦法可以處理。

⑨問題九：逐步回歸與分層回歸、線性回歸的區別，結果不一致怎么解釋？

逐步回歸是多元線性回歸中一種選擇自變量的方法。分別把每一個變量都選入模型中，每次都保留系數顯著水平最高的變量，剔除不顯著的變量，通過多次的選入和剔除最終得到系數的顯著的回歸方程。適合自變量個數較多時使用。

分層回歸本質是線性回歸，區別在於分層回歸可分為多層，主要用於模型的對比。

如果出現逐步回歸、分層回歸與線性回歸結果不一致的情況，主要是用於選入模型的自變量不同導致。逐步回歸會讓系統自動識別出有影響的自變量X，最終得到的模型與線性回歸中，自己分析的結果很可能出現不一致的情況。

最終以哪個結果為准，應結合專業知識和研究目的選擇。比如某個核心研究項很重要，在逐步回歸結果中沒有體現，此時更應選擇其他方法進行研究。

以上就是今天分享的內容，更多干貨內容登錄SPSSAU官網查看。

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 因子分析常見問題匯總，你想知道的都在這里 DevOps生命周期，你想知道的全都在這里了！分區4K對齊那些事，你想知道的都在這里生成器和協程 —— 你想知道的都在這里了你想了解的「SpringCloud」都在這里你想知道的特征工程，機器學習優化方法都在這了！收藏！【Spring】IOC容器注解匯總，你想要的都在這兒了！！ Java面試題中的Redis大合集，所有你想找的都在這里！不吹不擂，你想要的Python面試都在這里了【315+道題】計算機視覺學習之路（目錄）--你想要的都在這里了