原文鏈接:http://tecdat.cn/?p=13913
我們討論了使用程序來獲得預測的置信區間的方法。我們將討論線性回歸。
我們正在這里做出一個預測。正如在R課堂上(以及在預測模型的過程中)所回顧的,當我們要為預測提供一個置信區間時,建議您為預測器確定置信區間(這將取決於預測誤差)參數的估計)和潛在值的置信區間(這也取決於模型誤差,即殘差的離散度)。讓我們從預測的置信區間開始:
藍色值是可能的預測,可以通過在我們的觀察數據庫中重新采樣獲得。殘差(以及因此的斜率和回歸線的常數的估計值)的正態性假設下的置信區間(為90%)如下
我們可以在這里比較在500個生成的數據集上獲得的值的分布,並比較經驗分位數和假設正態性下的分位數,
數量比較
現在,讓我們來看另一種類型的置信區間,即關注變量的可能值。這次,除了繪制新樣本和計算預測值之外,我們還將在每次繪制中添加噪聲,我們獲得可能的值。
同樣,在這里,我們可以比較(以圖形方式開始)通過重采樣獲得的值,以及在正常情況下獲得的值,
從數字上給出以下比較
這次右側略有不對稱。顯然,我們不能假設高斯殘差,因為正值比負值大。考慮到數據的性質(距離不能為負),這是合理的。
然后,我們開始討論使用回歸模型。
然后,我們可以建立一個數據。
然后,我們可以使用基於 Stavros Christofides的對數增量支付模型的回歸模型,該模型基於對數正態模型,該模型最初由Etienne de Vylder於1978年提出。
我們獲得與通過Chain Ladder方法獲得的結果略有不同。如Hachemeister和Stanard在1975年所建議的,我們還可以嘗試Poisson回歸(具有對數鏈接),
該預測與通過鏈梯方法獲得的估計量一致。Klaus Schmidt和AngelaWünsche於1998年在鏈梯,邊際總和和最大似然估計中建立了帶有最小偏差方法的鏈接。