邏輯回歸解決共線性問題


解釋變量理論上的高度相關與觀測值高度相關沒有必然關系,有可能兩個解釋變量理論上高度相關,但觀測值未必高度相關,反之亦然。所以多重共線性本質上是數據問題。

造成多重共線性的原因有一下幾種:

1、解釋變量都享有共同的時間趨勢;

2、一個解釋變量是另一個的滯后,二者往往遵循一個趨勢;

3、由於數據收集的基礎不夠寬,某些解釋變量可能會一起變動;

4、某些解釋變量間存在某種近似的線性關系;

判別:

1、發現系數估計值的符號不對;

2、某些重要的解釋變量t值低,而R方不低

3、當一不太重要的解釋變量被刪除后,回歸結果顯著變化;

檢驗;

1、相關性分析,相關系數高於0.8,表明存在多重共線性;但相關系數低,並不能表示不存在多重共線性;

2、vif檢驗;

3、條件系數檢驗;

解決方法:

1、增加數據;

2、對模型施加某些約束條件;

3、刪除一個或幾個共線變量;

4、將模型適當變形;

5、主成分回歸

處理多重共線性的原則:

1、 多重共線性是普遍存在的,輕微的多重共線性問題可不采取措施;

2、 嚴重的多重共線性問題,一般可根據經驗或通過分析回歸結果發現。如影響系數符號,重要的解釋變量t值很低。要根據不同情況采取必要措施。

3、 如果模型僅用於預測,則只要擬合程度好,可不處理多重共線性問題,存在多重共線性的模型用於預測時,往往不影響預測結果;


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM