嶺回歸分析(Ridge Regresson Analysis)


 

簡介
1962年A.E.Hoerl首先提出,1970年他又和R.W.kennard合作在發表的論文中作了詳細的討論。應用回歸分析有一種實際情況是:研究者希望在回歸方程內包含2個或幾個高度相關的共線性自變量。

這在醫學研究中有時會遇到,例如有些生理指標,特別是生長發育指標(比如身高和體重),明知是高度相關的,有時卻希望把它們都引入回歸方程,以便作專業解釋。這時用逐步回歸法不合適,用一般回歸分析法所求得的各回歸系數值不穩定、難於解釋。嶺回歸分析針對這種實際情況,用改進的最小二乘法擬合多元線性回歸方程,叫做嶺回歸方程,可減少樣本回歸系數的標准誤,使各回歸系數值相對穩定和便於解釋。其基本原理是:在用樣本的相關系數值擬合標准化變量的嶺回歸方程時,把兩兩變量(包括自變量和應變量)Xi和Xj的相關系數rij,人為地減少成為rij/(1+k),k稱為嶺參數,取值0~1。求得的標准化嶺回歸系數可記作bi′(k),取使各bi′(k)相對穩定的k值,得標准化變量的嶺回歸方程為=b1′(k)X1′+b2′(k)X2′+…+bm′(k)Xm′。還可得嶺回歸方程為=a(k)+b1(k)X1+b2(k)X2+…+bm(k)Xm,bi(k)為嶺回歸系數。嶺回歸方程的方差分析、嶺回歸系數的標准誤等的運算和一般多元線性回歸分析的相同。嶺回歸分析主要用於解釋:用嶺回歸系數bi(k)說明各自變量和應變量的數量關系;用標准化嶺回歸系數bi′(k)比較各自變量對應變量的作用大小。要指出的是:相對於一般回歸分析所擬合的回歸方程,特別是相對逐步回歸分析所擬合的回歸方程,嶺回歸方程的剩余均方要大,因此預報效果要差,一般不用於預報。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM