?p=21625

我們知道參數的置信區間的計算，這些都服從一定的分布(t分布、正態分布），因此在標准誤前乘以相應的t分值或Z分值。但如果我們找不到合適的分布時，就無法計算置信區間了嗎？幸運的是，有一種方法幾乎可以用於計算各種參數的置信區間，這就是Bootstrap 法。

本文使用BOOTSTRAP來獲得預測的置信區間。我們將在線性回歸基礎上討論。

這是一個單點預測。當我們想給預測一個置信區間時，預測的置信區間取決於參數估計誤差。

預測置信區間

讓我們從預測的置信區間開始

藍色值是通過在我們的觀測數據庫中重新取樣獲得的可能預測值。值得注意的是，在殘差正態性假設下（回歸線的斜率和常數估計值），置信區間（90%）如下所示：

predict(reg,interval ="confidence",

在這里，我們可以比較500個生成數據集上的值分布，並將經驗分位數與正態假設下的分位數進行比較，

可以看出，經驗分位數與正態假設下的分位數是可以比較的。

現在讓我們看看另一種類型的置信區間，關於感興趣變量的可能值。這一次，除了提取新樣本和計算預測外，我們還將在每次繪制時添加噪聲，以獲得可能的值。

在這里，我們可以（首先以圖形方式）比較通過重新取樣獲得的值和在正態假設下獲得的值，

數值上給出了以下比較

這一次，右側有輕微的不對稱。顯然，我們不能假設高斯殘差，因為有更大的正值，而不是負值。考慮到數據的性質，這是有意義的（制動距離不能是負數）。

然后開始討論在供應中使用回歸模型。為了獲得具有獨立性，有人認為必須使用增量付款的數據，而不是累計付款。

可以創建一個數據庫，解釋變量是行和列。

然后，我們可以從基於對數增量付款數據的回歸模型開始，該模型基於對數正態模型

這與鏈式梯度法的結果略有不同，但仍然具有可比性。我們也可以嘗試泊松回歸（用對數鏈接）

預測結果與鏈式梯度法得到的估計值吻合。克勞斯·施密特（Klaus Schmidt）和安吉拉·溫什（Angela Wünsche）於1998年在鏈式梯度法、邊際和最大似然估計中建立了與最小偏差方法的聯系。

最受歡迎的見解

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 拓端tecdat|R語言使用bootstrap和增量法計算廣義線性模型（GLM）預測置信區間拓端數據tecdat|R語言貝葉斯線性回歸和多元線性回歸構建工資預測模型拓端tecdat|R語言預測人口死亡率：用李·卡特模型、非線性模型進行平滑估計拓端tecdat|R語言用邏輯回歸、決策樹和隨機森林對信貸數據集進行分類預測拓端tecdat|R語言相關分析和穩健線性回歸分析拓端tecdat：R語言用加性多元線性回歸、隨機森林、彈性網絡模型預測鮑魚年齡和可視化什么是置信度與置信區間置信度與置信區間拓端tecdat：R語言主成分回歸（PCR）、多元線性回歸特征降維分析光譜數據和汽車油耗、性能數據拓端tecdat|R語言泊松Poisson回歸模型預測人口死亡率和期望壽命