拓端tecdat|R語言中GLM(廣義線性模型),非線性和異方差可視化分析


 

 

原文鏈接:http://tecdat.cn/?p=13839

 

上周在 非人壽保險課程中,我們了解了廣義線性模型的理論,強調了兩個重要組成部分

  • 鏈接函數(這實際上是在預測模型的關鍵)

  • 分布或方差函數

考慮數據集

­lin.mod = lm(dist~speed,data=cars)

線性模型 

假設殘差獨立且具有相同的方差。如果我們可視化線性回歸,會看到:

 

這里的想法(在GLM中)是假設

它將基於某些誤差項生成與先前描述的模型相同的模型。該模型可以在下面看到,

C=trans3d(c(x,x),c(y,rev(y)),c(z,z0),mat)
polygon(C,border=NA,col="light blue",density=40)
C=trans3d(x,y,z0,mat)
lines(C,lty=2)
C=trans3d(x,y,z,mat)
lines(C,col="blue")}

 

這里確實有兩部分:平均值的線性增加  ​ 和正態分布的恆定方差  ​。

另一方面,如果我們假設泊松回歸,

poisson.reg = glm(dist~speed,data=cars,family=poisson(link="log"))

我們有這樣的結果

 

有兩件事同時發生了變化:我們的模型不再是線性的,而是指數的​,並且方差也隨着解釋變量的增加而增加​,因為有了泊松回歸,

如果改編前面的代碼,我們得到

 

問題是,當我們從線性模型引入Poisson回歸時,我們改變了兩件事。因此,讓我們看看當我們分別更改兩個組件時會發生什么。首先,我們可以使用高斯模型來更改鏈接函數,但是這次是乘法模型(具有對數鏈接函數)

 

這次是非線性的。或者我們可以在Poisson回歸中更改鏈接函數,以獲得線性模型,但異方差

 

因此,這基本上就是GLM的目的。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM