原文鏈接:http://tecdat.cn/?p=13885
在之前的課堂上,我們已經看到了如何可視化多元回歸模型(帶有兩個連續的解釋變量)。在此,目標是使用一些協變量(例如,駕駛員的年齡和汽車的年齡)來預測保險索賠的平均成本(請注意,此處的損失為責任損失)。通過對數鏈接從(標准)廣義線性模型獲得的預測。
可視化預測平均成本的代碼如下:首先,我們必須計算特定值的預測,
然后,我們使用此函數來計算網格上的值,
如果我們使用因子,而不是連續變量(這兩個變量的簡化版本),我們可以使用glm函數
(我們考慮的是笛卡爾乘積,因此將針對乘積,駕駛員年齡和汽車年齡的每個乘積計算值)
顯然,我們在這里缺少了一些東西,讓我們使用樣條曲線平滑這兩個變量,
使用加法平滑函數,我們獲得了一個對稱圖(由於加法特性)
而帶有二元樣條回歸gam
我不能在廣義線性模型中使用雙變量樣條,但是考慮到廣義可加模型(現在絕對不是可加模型),它確實可以工作。更准確地說,投資組合的分布是這兩個協變量的函數,如下所示
因此,駕駛一輛新車的年輕駕駛員的比例和駕駛一輛非常舊的汽車的老年駕駛員的比例相當小……如果目標是找到合適的位置,則應更仔細地看一下預測,但如果目標是為了使每個人都能獲得保險,也許我們應該允許某些司機的價格被低估(尤其是在投資組合中很少見的情況下)。並且應該記住,平均成本對巨額虧損極為敏感。