現代精算風險理論02:個體風險模型


第二講 個體風險模型

第一節 個體風險模型的分布

一、定義和相關說明

在個體風險模型中,我們感興趣的是多份保單總理賠額的分布。首先給出其定義和相關說明。

\(X_1,X_2,\cdots,X_n\) 分別為 \(n\) 份保單的理賠額,假設理賠風險 \(X_i\ (i=1,2,\cdots,n)\) 是相互獨立的,定義個體風險模型

\[S_n=X_1+X_2+\cdots+X_n. \]

個體風險模型又稱為短期風險模型,即不考慮時間因素,保單總數 \(n\) 為非隨機的風險模型。

從數學的角度看,總理賠額 \(S_n\) 是獨立同分布的隨機變量的和。我們的研究目標就是個體風險模型 \(S_n\) 的分布函數和數字特征等。

關於個體風險模型的一些說明:

  1. 一般非壽險保險的合同期往往較短,絕大多數是一年期。因此,通常不考慮貨幣的時間價值。但對於壽險來說,貨幣的時間價值是非常重要的。
  2. 獨立性的假設在保險實務中往往是不滿足的。例如同一建築中不同樓層的火災保險保單,那么這些保單風險相互之間是不獨立的。同樣,當某一自然災害發生時,如地震、台風等,同一地區的各類人壽保險或財產保險的索賠風險也是相關的。
  3. 本章中我們總是假設理賠風險 \(X_i\ (i=1,2,\cdots,n)\) 是相互獨立的。

二、卷積與變換

卷積運算是通過兩個獨立隨機變量 \(X\)\(Y\) 的分布函數來計算它們的和 \(X+Y\) 的分布函數的計算方法:

\[\begin{aligned} F_{X+Y}(s)&=\mathrm{Pr}(X+Y\leq s) \\ \\ &=\int_{-\infty}^\infty\mathrm{Pr}(X+Y\leq s|X=x)\mathrm{d}F_X(x) \\ \\ &=\int_{-\infty}^\infty\mathrm{Pr}(Y\leq s-x)\mathrm{d}F_X(x) \\ \\ &=\int_{-\infty}^\infty F_Y(s-x)\mathrm{d}F_X(x) \\ \\ &\equiv F_X*F_Y(s). \end{aligned} \]

分布函數 \(F_X* F_Y(s)\) 稱為分布函數 \(F_X(\cdot)\)\(F_Y(\cdot)\) 的卷積,即為 \(X+Y\) 的分布函數 \(F_{X+Y}(s)\)

如果 \(X\)\(Y\) 是離散型隨機變量,用 \(f_X(\cdot)\)\(f_Y(\cdot)\) 表示其概率分布列,則有

\[f_X*f_Y(s)=\sum_{x}f_Y(s-x)f_X(x), \]

其中求和是取遍所有使得 \(f_X(x)>0\)\(x\) ,即隨機變量 \(X\) 的所有可能取值。

如果 \(X\)\(Y\) 是連續型隨機變量,用 \(f_X(\cdot)\)\(f_Y(\cdot)\) 表示其概率密度函數,則有

\[f_X*f_Y(s)=\int_{-\infty}^\infty f_Y(s-x)f_X(x)\mathrm{d}x. \]

注意:卷積運算滿足交換律結合律,即

\[F_X*F_Y(s)=F_Y*F_X(s) , \\ \\ \left(F_X*F_Y\right)*F_Z(s)=F_X*\left(F_Y*F_Z\right)(s)=F_X*F_Y*F_Z(s). \]

卷積運算可以用來計算個體風險模型總理賠額的分布函數:

  • 如果理賠風險 \(X_i\) 的分布函數為 \(F_i(x)\ (i=1,2,\cdots,n)\) 且相互獨立,則 \(S_n\) 的分布函數為

    \[F_{S_n}(s)=F_1*F_2*\cdots*F_n(s). \]

  • 進一步假設 \(F_i(x)=F(x) \ (i=1,2,\cdots,n)\) ,則 \(S_n\) 的分布函數為

    \[F_{S_n}(s)=F*F\cdots*F(s)\equiv F^{*n}(s). \]

    稱為分布函數 \(F(x)\)\(n\) 重卷積。

利用 Laplace 變換可以方便我們對卷積進行運算:

  • Laplace 變換:對於函數 \(f(t)\) ,如果積分

    \[F(s)\equiv\int_0^\infty f(t)e^{-st}\mathrm{d}t<\infty, \]

    則稱 \(F(s)\) 為函數 \(f(t)\) 的 Laplace 變換,記為 \(F(s)=\mathcal{L}[f(t)]\)

    也稱 \(f(t)\) 為函數 \(F(s)\) 的 Laplace 逆變換,記為 \(f(t)=\mathcal{L}^{-1}[F(s)]\)

  • 卷積定理:對於函數 \(f(t)\)\(g(t)\) ,其卷積的 Laplace 變換為

    \[\mathcal{L}[f(t)* g(t)]=F(s)\cdot G(s), \]

    其中 \(F(s)\)\(G(s)\) 分別為 \(f(t)\)\(g(t)\) 的 Laplace 變換。

例如:設隨機變量 \(X\)\(Y\) 分別服從 \(\Gamma(\alpha_1,\beta)\)\(\Gamma(\alpha_2,\beta)\) ,其密度函數分別為 \(f(t)\)\(g(t)\) ,利用 Laplace 變換可得

\[\begin{aligned} &F(s)=\mathcal{L}[f(t)]=\int_0^\infty\frac{\beta^{\alpha_1}}{\Gamma(\alpha_1)}t^{\alpha_1-1}e^{-\beta t}e^{-st}\mathrm{d}t=\left(\frac{\beta}{\beta+s}\right)^{\alpha_1}, \\ \\ &G(s)=\mathcal{L}[g(t)]=\int_0^\infty\frac{\beta^{\alpha_2}}{\Gamma(\alpha_2)}t^{\alpha_2-1}e^{-\beta t}e^{-st}\mathrm{d}t=\left(\frac{\beta}{\beta+s}\right)^{\alpha_2}. \end{aligned} \]

由卷積定理可知

\[\mathcal{L}[f(t)* g(t)]=F(s)\cdot G(s)=\left(\frac{\beta}{\beta+s}\right)^{\alpha_1+\alpha_2}. \]

比較 \(\Gamma\) 分布的 Laplace 變換,可知 \(X+Y\) 仍服從 \(\Gamma\) 分布,參數為 \((\alpha_1+\alpha_2,\beta)\)

利用 Laplace 變換判斷隨機變量的方法,和矩母函數、特征函數的道理是一致的。

第二節 近似分布

一、中心極限定理

在概率論的極限理論中,當樣本量足夠大時,我們可以用中心極限定理去近似隨機變量的和的分布。首先我們回顧一下中心極限定理。

中心極限定理:設 \(X_1,X_2,\cdots,X_n\) 獨立同分布,其共同的均值為 \(\mu\) ,方差為 \(\sigma^2<\infty\) ,則有

\[\lim_{n\to\infty}{\rm Pr}\left[\sum_{i=1}^nX_i\leq n\mu+s\sigma\sqrt{n}\right]=\Phi(x), \]

其中 \(\Phi(x)\) 為標准正態分布的分布函數。

基於上述結果,個體風險模型 \(S_n\) 的近似分布可以表示為

\[F_S(s)\approx \Phi\left(s;n\mu,n\sigma^2\right). \]

然而,中心極限定理並不適用於損失分布的近似。這是因為保險風險往往是尾部較重的風險,用正態分布來近似隨機變量的和的分布,特別是對尾部概率的近似,並不能夠很好的符合實際情況。

在進行精算分析時,對尾部概率的近似估計往往願意采用保守的估計,即和精確值比較接近,可以略大於精確值。常用的兩種近似分布是平移伽馬近似和正態冪階近似。

二、平移伽馬近似

選擇平移伽馬分布作為損失分布的近似分布,主要原因是大多數非壽險保單的理賠分布近似伽馬分布,其特點為右偏態,取值非負,且具有單峰性。

一般伽馬分布有 \(\alpha\)\(\beta\) 兩個參數,\(\Gamma(\alpha,\beta)\) 的密度函數為

\[f(x;\alpha,\beta)=\frac{\beta^\alpha}{\Gamma(\alpha)}x^{\alpha-1}e^{-\beta x} , \quad x>0. \]

\(Z\sim \Gamma(\alpha,\beta)\) ,則 \(Z\) 的均值、方差和偏度分別為

\[\mathbb{E}(Z)=\frac{\alpha}{\beta},\quad {\rm Var}(Z)=\frac{\alpha}{\beta^2},\quad \gamma_Z=\frac{3}{\sqrt{\alpha}}. \]

平移伽馬分布引入了第三個參數——偏移 \(x_0\) ,即采用 \(Z+x_0\) 的分布作為損失分布 \(S\) 的近似,

\[S\stackrel{d}{\approx}Z+x_0, \\ \\ F_S(s)\approx \mathrm{Pr}(Z+x_0\leq s)=G(s-x_0;\alpha,\beta), \]

其中 \(G(x;\alpha,\beta)\)\(\Gamma(\alpha,\beta)\) 的分布函數。

平移伽馬分布的均值、方差和偏度分別為

\[\mathbb{E}(Z+x_0)=x_0+\frac\alpha\beta , \quad {\rm Var}(Z+x_0)=\frac\alpha{\beta^2},\quad \gamma_{Z+x_0}=\frac{2}{\sqrt{\alpha}}. \]

如果已知損失 \(S\) 的均值、方差和偏度分別為 \(\mu_S,\sigma_S^2\)\(\gamma_S\) 。如果我們采用兩個分布對應的前三階矩相同的方式給出近似分布,則 \(\alpha,\beta\)\(x_0\) 的選取需要滿足如下的方程:

\[\begin{aligned} &\mu_S=\mathbb{E}(Z+x_0)=x_0+\frac\alpha\beta, \\ \\ &\sigma_S^2={\rm Var}(Z+x_0)=\frac\alpha{\beta^2}, \\ \\ &\gamma_S=\gamma_{Z+x_0}=\frac{2}{\sqrt{\alpha}}. \end{aligned} \]

解方程可得

\[\alpha=\frac{4}{\gamma_S^2}, \quad \beta=\frac{2}{\gamma_S\sigma_S},\quad x_0=\mu_S-\frac{2\sigma_S}{\gamma_S}. \]

注意:

  • 為使這種近似方法有效,偏度必須嚴格為正值,即 \(\gamma_S>0\) 。若 \(\gamma_S\to0\) ,則與正態近似接近。
  • 如果兩個分布函數的前三階矩相同,則彼此之間的差異不會太大。
  • 雖然沒有類似中心極限定理一樣精確的理論證明,但實際經驗發現,大多數損失分布采用平移伽馬分布作為近似有較好的效果。

三、正態冪階近似

另一種損失分布的近似方法是正態冪階近似,又稱為 NP 近似,它也是一種使用近似隨機變量前三階矩的近似方法,要求損失分布的矩母函數存在。

如果已知 \(\mathbb{E}(S)=\mu_S,\ {\rm Var}(S)=\sigma_S^2\) 以及偏度 \(\gamma_S\) ,則當 \(s\geq1\) 時,

\[\mathrm{Pr}\left[\frac{S-\mu_S}{\sigma_S}\leq s+\frac{\gamma_S}{6}(s^2-1)\right]\approx\Phi(s). \]

或等價地,當 \(x\geq1\) 時,

\[\mathrm{Pr}\left[\frac{S-\mu_S}{\sigma_S}\leq x\right]\approx\Phi\left(\sqrt{\frac{9}{\gamma_S^2}+\frac{6x}{\gamma_S}+1}-\frac{3}{\gamma_S}\right). \]

一般地,第一個公式可以得到近似 \(S\) 的分位數,第二個公式可以得到近似 \(S\) 的分布函數。

引理:設 \(X_i\ (i=1,2,\cdots,n)\) 是獨立同分布的隨機變量,其偏度為 \(\gamma_X\) ,定義隨機變量

\[S=X_1+X_2+\cdots+X_n, \]

\(S\) 的偏度為

\[\gamma_S=n^{-1/2}\gamma_X. \]

首先計算 \(S\) 的前三階矩:

\[\begin{aligned} &\mathbb{E}(S)=n\mathbb{E}(X), \\ \\ &{\rm Var}(S)=n{\rm Var}(X) , \\ \\ &\mathbb{E}\left[(S-\mathbb{E}(S))^3\right]=\mathbb{E}\left[\sum_{i=1}^n(X_i-\mathbb{E}(X_i))\right]^3=n\mathbb{E}\left[(X-\mathbb{E}(X))^3\right]. \end{aligned} \]

所以

\[\gamma_S=\frac{\mathbb{E}\left[(S-\mathbb{E}(S))^3\right]}{(\sqrt{{\rm Var}(S)})^3}=\frac{n\mathbb{E}\left[(X-\mathbb{E}(X))^3\right]}{(\sqrt{n{\rm Var}(X)})^3}=n^{-1/2}\gamma_X. \]

我們可以用 Edgeworth 展開推導 NP 近似,但這不是嚴格的數學證明

假設理賠風險 \(X_i\ (i=1,2,\cdots,n)\) 獨立同分布,其均值為 \(\mu_X\) ,方差為 \(\sigma_X^2\) ,偏度為 \(\gamma_X\)

於是個體風險模型 \(S\) 的均值為 \(\mu_S=n\mu_X\) ,方差為 \(\sigma_S^2=n\sigma_X^2\) ,偏度為 \(\gamma_S=n^{-1/2}\gamma_X\)

定義 \(Z\) 為個體風險模型 \(S\) 的標准化隨機變量,則有

\[Z=\frac{S-\mathbb{E}(S)}{\sqrt{{\rm Var}(S)}} , \quad \gamma_Z =\mathbb{E}\left(Z^3\right)=\gamma_S=\frac{\gamma_X}{\sqrt{n}}. \]

\(S\)\(Z\) 的偏度相等,並且和理賠風險 \(X_i\ (i=1,2,\cdots,n)\) 的偏度 \(\gamma_X\) 滿足上式關系。

\(Z\) 的累積量母函數,有

\[\begin{aligned} \log\mathbb{E}(e^{tZ})&=\mathbb{E}(Z)t+{\rm Var}(Z)\frac12t^2+\mathbb{E}\left[(Z-\mathbb{E}(Z))^3\right]\frac16t^3+\cdots \\ \\ &=\frac12t^2+\frac16\gamma_Z t^3+\cdots\\ \\ &=\frac12t^2+\frac16n^{-1/2}\gamma_Xt^3+\cdots. \end{aligned} \]

因此,對 \(Z\) 的矩母函數,有

\[\mathbb{E}(e^{tZ})=\exp\left\{\frac12t^2\right\}\exp\left\{\frac16n^{-1/2}\gamma_Xt^3+\cdots\right\}. \]

標准正態分布的分布函數 \(\Phi(x)\) 與密度函數 \(\phi(x)\) 及其導數的關系:

\[\begin{aligned} &\Phi'(x)=\phi(x), \\ \\ &\Phi''(x)=\phi'(x)=-x\phi(x), \\ \\ &\Phi^{(3)}(x)=\phi''(x)=(x^2-1)\phi(x), \\ \\ &\Phi^{(4)}(x)=\phi^{(3)}(x)=(3x-x^3)\phi(x). \end{aligned} \]

可以證明如下的關系式:

\[\begin{aligned} &\int_{-\infty}^\infty e^{tx}\phi^{(3)}(x)\mathrm{d}x=-t^3\exp\left\{\frac12t^2\right\}, \\ \\ &\int_{-\infty}^\infty e^{tx}\phi(x)\mathrm{d}x=\exp\left\{\frac12t^2\right\}. \end{aligned} \]

隨機變量 \(Z\) 的分布函數的 Edgeworth 展開

\[\begin{aligned} F_Z(x)&=\Phi(x)-\frac16\gamma_Z\Phi^{(3)}(x)+\cdots \\ \\ &=\Phi(x)-\frac16n^{-1/2}\gamma_X\Phi^{(3)}(x)+\cdots \\ \\ &\approx\Phi(x)-\frac16n^{-1/2}\gamma_X\Phi^{(3)}(x). \end{aligned} \]

最后一行稱為隨機變量 \(Z\) 的分布函數的 Edgeworth 近似

注意:當 \(x>1\) 時,\(\Phi^{(3)}(x)=(x^2-1)\phi(x)>0\) ,於是

\[\frac16n^{-1/2}\gamma_X\Phi^{(3)}(x)>0, \]

由此推出 \(F_Z(x)<\Phi(x)\) ,進而有尾部概率 \(\overline{F}_Z(x)>\overline\Phi(x)\) ,即采用 Edgeworth 近似所得到的尾部概率比中心極限定理計算出的值要大。

由於不能保證Edgeworth 近似是一個增函數,因此我們試圖找到一個修正函數 \(\delta=\delta(s)\) ,使得

\[F_Z(s+\delta)\approx \Phi(s), \quad \delta>0. \]

這意味着我們需要找到輔助函數 \(g(\delta)\) 的零點來估計 \(\delta\) ,其中 \(g(\delta)\) 的定義為

\[\begin{aligned} g(\delta)&=\Phi(s)-F(s+\delta) \\ \\ &=\Phi(s)-\left[\Phi(s+\delta)-\frac16n^{-1/2}\gamma_X\Phi^{(3)}(s+\delta)\right]. \end{aligned} \]

於是有

\[\begin{aligned} g(0)&=\frac16n^{-1/2}\gamma_X\Phi^{(3)}(s), \\ \\ g'(0)&=-\Phi'(s)+\frac16n^{-1/2}\gamma_X\Phi^{(4)}(s). \end{aligned} \]

由 Taylor 展開 \(g(\delta)\approx g(0)+\delta g'(0)\) ,再令 \(g(\delta)\approx0\) 可得

\[\begin{aligned} \delta&\approx -\frac{g(0)}{g'(0)} \\ \\ &=-\frac{\dfrac16n^{-1/2}\gamma_X\Phi^{(3)}(s)}{-\Phi'(s)+\dfrac16n^{-1/2}\gamma_X\Phi^{(4)}(s)} \\ \\ &=-\frac{\dfrac16n^{-1/2}\gamma_X(s^2-1)\phi(s)}{\left[-1+\dfrac16n^{-1/2}\gamma_X(-s^3+3s)\right]\phi(s)} \\ \\ &\approx\dfrac16n^{-1/2}\gamma_X(s^2-1) \\ \\ &=\frac16\gamma_Z(s^2-1)=\frac16\gamma_S(s^2-1). \end{aligned} \]

所以當 \(\delta=\dfrac16\gamma_S(s^2-1)\) 時,\(F_Z(s+\delta)\approx\Phi(s)\) ,代入可得 NP 近似

\[\mathrm{Pr}\left[\frac{S-\mu_S}{\sigma_S}\leq s+\frac{\gamma_S}{6}(s^2-1)\right]=F_Z\left(s+\frac{\gamma_S}6(s^2-1)\right)\approx \Phi(s). \]

四、案例

例如:假設總理賠支付 \(S\) 的均值為 \(10000\) ,標准差為 \(1000\) ,偏度為 \(1\)

(1) 計算資本量 \(13000\) 不足以彌補損失 \(S\) 的概率的近似值。

中心極限定理

\[\mathrm{Pr}(S>13000)\approx 1-\Phi\left(\frac{13000-10000}{1000}\right)=0.0013. \]

平移伽馬近似

\[\alpha=4,\quad\beta=0.002,\quad x_0=8000, \\ \\ \begin{aligned} \mathrm{Pr}(S>13000)&\approx1-G(13000-8000;4,0.002) \\ \\ &=1-G(5000;4,0.002) \\ \\ &=1-G(0.5;4,20) \\ \\ &=0.0103. \end{aligned} \]

NP 近似

\[\begin{aligned} \mathrm{Pr}(S>13000)&=\mathrm{Pr}\left(\frac{S-10000}{1000}>3\right) \\ \\ &\approx1-\Phi\left(\sqrt{9+6\times3+1}-3\right) \\ \\ &=0.011. \end{aligned} \]

(2) 計算資本量,使得資本量以 \(95\%\) 的概率不小於理賠額 \(S\) 。標准正態分布 \(0.95\) 分位數為

\[\Phi(s)=0.95 \quad \iff \quad s=1.645. \]

中心極限定理

\[\mathrm{Pr}\left[\frac{S-10000}{1000}\leq s\right]\approx\Phi(s)=0.95, \]

解得 \(S\)\(95\%\) 的分位點為

\[S_{(0.95)}\approx10000+1000\times1.645=11645. \]

NP 近似

\[\mathrm{Pr}\left[\frac{S-10000}{1000}\leq s+\frac{1}{6}(s^2-1)\right]\approx\Phi(s)=0.95, \]

解得 \(S\)\(95\%\) 的分位點為

\[S_{(0.95)}\approx10000+1000\times\left(1.645+\frac16\left(1.645^2-1\right)\right)=11929. \]

例如:假設有 \(n=1000\) 個年輕男性購買了保險期限為一年的保單,每個投保人在一年內死亡的概率為 \(0.001\) ,且死亡發生的理賠支付為 \(1\) ,總理賠支付 \(S\) 服從二項分布 \(B(1000,0.001)\) 。求這批保單總理賠支付至少為 \(4\) 的概率。

二項分布(精確值)

\[\mathrm{Pr}(S\geq4)=0.01893. \]

泊松分布:由於這里 \(n=1000\) 非常大,\(p=0.001\) 非常小,根據泊松定理,我們可以用泊松分布 \(P(np)\) 來近似所求的概率。如果 \(S\sim P(1)\) ,則有

\[\mathrm{Pr}(S\geq4)=1-e^{-1}-e^{-1}-\frac12e^{-1}-\frac12e^{-1}=0.01899. \]

中心極限定理:由於正態分布是連續的,所以采用 \(x=3.5\) 估計尾部概率。

\[\mu_S=1000\times0.001=1,\quad \sigma_S=\displaystyle\sqrt{1000\times0.001\times 0.999}=0.9995 , \\ \\ \mathrm{Pr}(S\geq3.5)=\mathrm{Pr}\left[\frac{S-\mu_S}{\sigma_S}\geq\frac{3.5-\mu_S}{\sigma_S}\right]\approx1-\Phi(2.5)=0.0062. \]

可以看出,利用中心極限定理近似尾部概率的效果很差,估計出的尾部概率比精確值小很多。

平移伽馬近似:由於平移伽馬分布也是連續的,所以同樣采用 \(x=3.5\) 估計尾部概率。這里我們仍然假設 \(S\sim P(1)\) ,則有 \(\mu_S=1,\ \sigma_S=1, \ \gamma_S=1\) ,於是

\[\alpha=4 , \quad \beta=2,\quad x_0=-1 \\ \\ \mathrm{Pr}(S\geq3.5)\approx1-G(3.5-(-1);4,2)=0.0212. \]

NP 近似

\[\begin{aligned} \mathrm{Pr}(S\geq3.5)&=\mathrm{Pr}\left[\frac{S-\mu_S}{\sigma_S}\geq\frac{3.5-\mu_S}{\sigma_S}\right]\\ \\ &\approx1-\Phi\left(\sqrt{9+6\times2.5+1}-3\right) \\ \\ &=1-\Phi(2) \\ \\ &=0.0228. \end{aligned} \]


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM