拓端tecdat|R語言預測人口死亡率:用李·卡特模型、非線性模型進行平滑估計


原文鏈接:http://tecdat.cn/?p=13663

 


 

今天早上,我和同事一起分析死亡率。我們在研究人口數據集,可以觀察到很多波動性。我們得到這樣的結果:

 

由於我們缺少一些數據,因此我們想使用一些廣義非線性模型。因此,讓我們看看如何獲​​得死亡率曲面圖的平滑估計。我們編寫一些代碼。


D=DEATH$Male
E=EXPO$Male
A=as.numeric(as.character(DEATH$Age))
Y=DEATH$Year
I=(A<100)
base=data.frame(D=D,E=E,Y=Y,A=A)
subbase=base[I,]
subbase=subbase[!is.na(subbase$A),]

第一個想法可以是使用Poisson模型,其中死亡率是年齡和年份的平穩函數,類似於

​可以使用


persp(vZ,theta=-30,col="green",shade=TRUE,xlab="Ages (0-100)",
ylab="Years (1900-2005)",zlab="Mortality rate (log)")

死亡率曲面圖

 

還可以提取年份的平均值,這是​ Lee-Carter模型中系數的解釋  

predAx=function(a) mean(predict(regbsp,newdata=data.frame(A=a,
Y=seq(min(subbase$Y),max(subbase$Y)),E=1)))
plot(seq(0,99),Vectorize(predAx)(seq(0,99)),col="red",lwd=3,type="l")

我們有以下平滑的死亡率

 

回顧下李·卡特模型是

可以使用以下方法獲得參數估計值

persp(vZ,theta=-30,col="green",shade=TRUE,xlab="Ages (0-100)",
ylab="Years (1900-2005)",zlab="Mortality rate (log)")

粗略的死亡率曲面圖是

 

有以下  ​ 系數。

plot(seq(1,99),coefficients(regnp)[2:100],col="red",lwd=3,type="l")

 

這里我們有很多系數,但是,在較小的數據集上,我們具有更多的可變性。我們可以平滑李·卡特模型: 

 代碼片段


persp(vZ,theta=-30,col="green",shade=TRUE,xlab="Ages (0-100)", 
ylab="Years (1900-2005)",zlab="Mortality rate (log)")

現在的死亡人數是

 

得出多年來隨年齡變化的平均死亡率,

BpA=bs(seq(0,99),knots=knotsA,Boundary.knots=range(subbase$A),degre=3)
Ax=BpA%*%coefficients(regsp)[2:8]
plot(seq(0,99),Ax,col="red",lwd=3,type="l")

 

然后,我們可以使用樣條函數的平滑參數,並查看對死亡率曲面的影響

persp(vZ,theta=-30,col="green",shade=TRUE,xlab="Ages (0-100)",
ylab="Years (1900-2005)",zlab="Mortality rate (log)")

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM