現代精算風險理論01:損失分布


第一講 損失分布

第一節 隨機變量的數字特征

一、特征函數和矩母函數

特征函數和矩母函數是對分布函數的變換,常用於確定獨立隨機變量之和的分布。

特征函數:對於隨機變量 \(X\) ,其分布函數為 \(F(x)\) ,其特征函數的定義為:

\[\phi_X(t)=\mathbb{E}\left[e^{\mathrm{i}tX}\right] . \]

定理:分布函數序列 \(F_n(x)\) 收斂於分布函數 \(F(x)\) 的充分必要條件是 \(F_n(x)\) 的特征函數 \(\phi_n(t)\) 收斂於 \(F(x)\) 的特征函數 \(\phi(t)\)

矩母函數:對於隨機變量 \(X\) ,其分布函數為 \(F(x)\) ,其矩母函數的定義為:

\[m_X(t)=\mathbb{E}\left[e^{tX}\right] . \]

矩母函數一般要求 \(t>0\) ,並且 \(t\) 的取值范圍和參數分布的參數有關,使得矩母函數存在。

定理:隨機變量 \(X\)\(k\) 階矩等於矩母函數的 \(k\) 階導數在 \(t=0\) 處的取值,即

\[\mathbb{E}\left[X^k\right]=\frac{\mathrm{d}^k}{\mathrm{d}t^k}m_X(t)\bigg|_{t=0}. \]

定理:如果隨機變量 \(X\)\(Y\) 相互獨立,則有

\[\begin{aligned} &\phi_{X+Y}(t)=\mathbb{E}\left[e^{\mathrm{i}t(X+Y)}\right]=\mathbb{E}\left[e^{\mathrm{i}tX}\right]\mathbb{E}\left[e^{\mathrm{i}tY}\right]=\phi_X(t)\phi_Y(t). \\ \\ &m_{X+Y}(t)=\mathbb{E}\left[e^{t(X+Y)}\right]=\mathbb{E}\left[e^{tX}\right]\mathbb{E}\left[e^{tY}\right]=m_X(t)m_Y(t). \end{aligned} \]

注意:隨機變量的矩母函數可能存在,也可能不存在。如果隨機變量的矩母函數不存在,則該隨機變量的分布被稱為重尾分布或厚尾分布(這是重尾分布的一種定義)。

定理:假設隨機變量 \(X_n\)\(X\) 的矩母函數存在,則 \(X_n\) 的矩母函數 \(m_n(t)\) 收斂於 \(X\) 的矩母函數 \(m(t)\) 的充分必要條件是 \(X_n\) 的分布函數 \(F_n(x)\) 收斂於 \(X\) 的分布函數 \(F(x)\)

二、概率母函數和累積量母函數

概率母函數:對於隨機變量 \(X\) ,其概率母函數的定義為:

\[g_X(t)=\mathbb{E}\left[t^X\right]=\sum_{k=0}^\infty t^k\mathrm{Pr}(X=k). \]

從定義可以看出,概率母函數僅用於取值為自然數的隨機變量。當 \(|t|\leq1\) 時,該級數是絕對收斂的。

累積量母函數:對於隨機變量 \(X\) ,其分布函數為 \(F(x)\) ,其累積量母函數的定義為:

\[\kappa_X(t)=\log m_X(t)=\log\mathbb{E}\left[e^{tX}\right]. \]

累積量母函數為計算隨機變量的中心矩提供了很大方便。記 \(\mu_k=\mathbb{E}\left[X^k\right]\) ,並以 \(O(t^k)\) 表示 \(t\)\(k\) 次冪或高於 \(k\) 次冪。首先對矩母函數 \(m_X(t)\)\(t=0\) 處進行 Taylor 展開,

\[m_X(t)=\mathbb{E}\left[e^{tX}\right]=1+\mu_1t+\frac12\mu_2t^2+\frac16\mu_3t^3+O(t^4), \]

再利用 \(\log(1+x)\) 的 Taylor 展開式可得

\[\begin{aligned} \log\mathbb{E}\left[e^{tX}\right]&=\log\left(1+\mu_1t+\frac12\mu_2t^2+\frac16\mu_3t^3+O(t^4)\right) \\ \\ &\begin{aligned} &=\mu_1t+\frac12\mu_2t^2+\frac16\mu_3t^3+O(t^4) \\ \\ &\quad\, -\frac12\left(\mu_1^2t^2+\mu_1\mu_2t^3+O(t^4)\right) \\ \\ &\quad\, +\frac13\left(\mu_1^3t^3+O(t^4)\right)+O(t^4) \end{aligned}\\ \\ &=\mu_1t+\frac12\left(\mu_2-\mu_1^2\right)t^2+\frac16\left(\mu_3-3\mu_1\mu_2+2\mu_1^3\right)t^3+O(t^4) \\ \\ &=\mathbb{E}[X]t+{\rm Var}(X)\frac12t^2+\mathbb{E}\left[(X-\mathbb{E}(X))\right]\frac16t^3+O(t^4). \end{aligned} \]

定理:隨機變量 \(X\)\(k\) 階中心矩等於累積量母函數的 \(k\) 階導數在 \(t=0\) 處的取值,記為

\[\kappa_k\equiv\mathbb{E}\left[(X-\mathbb{E}(X))^k\right]=\frac{\mathrm{d}^k}{\mathrm{d}t^k}\kappa_X(t)\bigg|_{t=0}. \]

特別地,常用的中心矩如下:

\[\kappa_1=\mathbb{E}(X), \quad \kappa_2={\rm Var}(X),\quad \kappa_3=\mathbb{E}\left[(X-\mathbb{E}(X))^3\right]. \]

偏度:對於隨機變量 \(X\) ,其偏度的定義為

\[\gamma_X=\frac{\kappa_3}{\kappa_2^{3/2}}=\frac{\mathbb{E}\left[(X-\mathbb{E}(X))^3\right]}{(\sqrt{{\rm Var}(X)})^3}. \]

偏度是描述隨機變量分布非對稱程度的數值特征,描述隨機變量分布偏斜的方向和程度。

  • 如果 \(\gamma_X>0\) ,則稱隨機變量的分布函數具有右偏態,或稱右拖尾;
  • 如果 \(\gamma_X<0\) ,則稱隨機變量的分布函數具有左偏態,或稱左拖尾;
  • 如果隨機變量 \(X\) 的分布函數是對稱的,則有 \(\gamma_X=0\) ,但反之並不成立,即如果 \(\gamma_X=0\) ,隨機變量 \(X\) 的分布函數不一定是對稱的。

性質:特征函數、累積量母函數和概率母函數都可以看成是矩母函數的函數,其關系如下:

  • 特征函數:\(\phi_X(t)=m_X(\mathrm{i}t)\)
  • 累積量母函數:\(\kappa_X(t)=\log(m_X(t))\)
  • 概率母函數:\(g_X(t)=m_X(\log t)\)

第二節 索賠次數的損失分布

一、索賠次數的損失分布族

損失與賠付是兩個不同但又密切相關的概念:

  • 損失是指承保險標的可能發生的實際損失大小;
  • 賠付是指保險人按承保合同規定的保險責任所支付的實際費用;
  • 賠付是損失的函數,小於等於實際損失;
  • 從數學的角度,損失和賠付均是隨機的,可以看成是隨機變量。

由於常見的索賠次數的損失分布均為取值為自然數的隨機變量,因此可以采用概率母函數來描述這類隨機變量的分布的特征。

常見的索賠次數的損失分布包括二項分布、幾何分布、負二項分布和泊松分布等等,這里給出它們的概率分布列:

二項分布 \(B(n,\theta)\)

\[f(x)={n\choose x}\theta^x(1-\theta)^{n-x},\quad x=0,1,\cdots,n. \]

幾何分布 \(G(\theta)\)

\[f(x)=\theta(1-\theta)^x,\quad x=0,1,\cdots . \]

負二項分布 \(NB(r,\theta)\)

\[f(x)={x+r-1 \choose r-1}\theta^r(1-\theta)^x,\quad x=0,1,\cdots . \]

泊松分布 \(P(\lambda)\)

\[f(x)=e^{-\lambda}\frac{\lambda^x}{x!},\quad x=0,1,\cdots. \]

下面給出 \((a,b,0)\) 族和 \((a,b,1)\) 族的定義。

如果非負離散隨機變量 \(X\) 的概率分布滿足

\[f_X(x)=\left(a+\frac bx\right)f_X(x-1),\quad x=1,2,\cdots, \]

則稱隨機變量 \(X\) 屬於 \((a,b,0)\) 族,其中 \(a\)\(b\) 為常數,\(f(0)\) 給定,簡記為 \(X\in(a,b,0)\)

如果非負離散隨機變量 \(X\) 的概率分布滿足

\[f_X(x)=\left(a+\frac bx\right)f_X(x-1),\quad x=2,3\cdots, \]

則稱隨機變量 \(X\) 屬於 \((a,b,1)\) 族,其中 \(a\)\(b\) 為常數,\(f(1)\) 給定,簡記為 \(X\in(a,b,1)\)

從定義可以看出,\((a,b,0)\) 族與 \((a,b,1)\) 族具有相同的迭代公式,所不同的只是起始點的不同。類似地也可以繼續定義 \((a,b,2)\) 族等等。

常見的索賠次數的損失分布均屬於 \((a,b,0)\) 族,這里給出它們的 \(a,b\)\(f(0)\) 的取值:

二項分布:

\[a=-\dfrac{\theta}{1-\theta},\quad b=\dfrac{\theta(n+1)}{1-\theta},\quad f(0)=(1-\theta)^n. \]

幾何分布:

\[a=1-\theta,\quad b=0,\quad f(0)=\theta. \]

負二項分布:

\[a=1-\theta,\quad b=(r-1)(1-\theta),\quad f(0)=\theta^r. \]

泊松分布:

\[a=0,\quad b=\lambda,\quad f(0)=e^{-\lambda}. \]

二、零調整分布和零截斷分布

一般情形下,若損失 \(X\in(a,b,1)\) ,則 \(f(0)\neq0\) ,保險索賠分布往往具有這種性質。

因為一般情形下,保險索賠次數發生 \(0\) 次的概率很高,因此 \((a,b,1)\) 族分布更符合保險中的損失分布的意義,而 \((a,b,0)\) 族分布不能很好地刻畫索賠次數。

因此需要修改保險索賠次數發生 \(0\) 次的概率,即修改 \((a,b,0)\) 族分布在 \(0\) 點的概率來得到 \((a,b,1)\) 族分布,這就是零調整分布。

零調整分布:記損失 \(X\in(a,b,0)\) ,修正后的分布 \(Y\in(a,b,1)\) ,並且

\[f_Y(i)=c f_X(i),\quad i=1,2,\cdots, \]

則有如下關系

\[1=f_Y(0)+\sum_{i=1}^\infty f_Y(i)=f_Y(0)+c\sum_{i=1}^\infty f_Y(i)=f_Y(0)+c\left[1-f_X(0)\right]. \]

所以可以推出

\[c=\frac{1-f_Y(0)}{1-f_X(0)} , \quad c<1. \]

隨機變量 \(Y\) 稱為基於隨機變量 \(X\) 的零調整分布。

注意:構造零調整分布的目的是將一個 \((a,b,0)\) 族分布的 \(f(0)\) 調整為一個較大的概率。還有一種與之相對的分布稱為零截斷分布,其目的是將 \((a,b,0)\) 族分布的 \(f(0)\) 調整為 \(0\)

零截斷分布:記損失 \(X\in(a,b,0)\) ,修正后的分布為 \(Z\) ,滿足 \(f_Z(0)=0\) ,並且

\[f_Z(i)=c f_X(i),\quad i=1,2,\cdots, \]

則有如下關系

\[1=\sum_{i=1}^\infty f_Z(i)=c\sum_{i=1}^\infty f_X(i)=c\left[1-f_X(0)\right]. \]

所以可以推出

\[c=\frac{1}{1-f_X(0)} , \quad c>1. \]

隨機變量 \(Z\) 稱為基於隨機變量 \(X\) 的零截斷分布。

例如:寫出 \(X\sim B(4,0.3)\) 的零調整分布 \(Y\) 和零截斷分布 \(Z\) 的概率分布列,其中 \(f_Y(0)=0.4\)

零調整分布:

\[c=\frac{1-f_Y(0)}{1-f_X(0)}=\frac{1-0.4000}{1-0.2401}=0.7896. \]

零截斷分布:

\[c=\frac{1}{1-f_X(0)}=\frac{1}{1-0.2401}=1.3160. \]

修改后的結果如下表所示

\[\begin{array}{c|c|c|c} \hline i & X & Y & Z \\ \hline 0 & 0.2401 & 0.4000 & 0 \\ 1 & 0.4116 & 0.3250 & 0.5416 \\ 2 & 0.2646 & 0.2089 & 0.3842 \\ 3 & 0.0756 & 0.0597 & 0.0995 \\ 4 & 0.0081 & 0.0064 & 0.0107 \\ \hline \end{array} \]

三、復合分布

假設 \(\{X_i,i=1,2,\cdots\}\) 是取值為正整數的隨機變量,且均與 \(X\) 同分布,假設 \(N\) 也是取值為正整數的隨機變量,且與 \(\{X_i,i=1,2,\cdots\}\) 獨立,定義

\[S=X_1+X_2+\cdots+X_N, \]

稱隨機變量 \(S\) 的分布為復合分布。

例如:假設 \(X_1\)\(X_2\) 獨立同分布,且服從二項分布 \(B(2,0.1)\) ,假設 \(N\) 服從兩點分布

\[f_N(1)=f_N(2)=\frac12, \]

計算 \(S\) 的分布。

:注意到 \(S\) 是一個離散型隨機變量,可能的取值為 \(0,1,2,3,4\) 。計算 \(S\) 的概率分布列為

\[\begin{array}{c|ccccc} S & 0 & 1 & 2 & 3 & 4\\ \hline \mathrm{Pr} & 0.73305 & 0.23580 & 0.02930 & 0.00180 & 0.00005 \end{array} \]

第三節 索賠額的損失分布

一、常用的索賠額分布

(1) 指數分布 \({\rm Exp}(\lambda)\) ,指數分布是一種尾比較輕的分布。

(2) 伽馬分布 \(\Gamma(\alpha,\beta)\) ,適用於理賠分布不是太重的情形,例如在機動車險中自己車輛損傷保險。

(3) 對數正態分布 \(LN(\mu,\sigma^2)\) ,適用於理賠分布略重一些的情形,例如火災險中的理賠額。

(4) Pareto 分布 \(P(\alpha,\gamma)\) ,其概率密度函數為

\[f(x)=\frac{\alpha\gamma^\alpha}{(x+\gamma)^{\alpha+1}} ,\quad x>0. \]

適用於發生大理賠的可能性很大的情形,特別是在第三者責任險中。

(5) 逆高斯分布 \(IG(\alpha,\beta)\) ,其分布函數為

\[F(x;\alpha,\beta)=\Phi\left(\frac{-\alpha}{\sqrt{\beta x}}+\sqrt{\beta x}\right)+e^{2\alpha}\Phi\left(\frac{-\alpha}{\sqrt{\beta x}}-\sqrt{\beta x}\right). \]

注意:當 \(x\to 0^+\) 時,該分布函數的極限為 \(0\) ;當 \(x\to\infty\) 時,該分布函數的極限為 \(1\)

其概率密度函數為分布函數的導數,在 \((0,\infty)\) 上取正值,具有如下形式:

\[f(x;\alpha,\beta)=\frac{\alpha}{\sqrt{2\pi\beta}}x^{-3/2}\exp\left\{{-\frac{(\alpha-\beta x)^2}{2\beta x}}\right\} ,\quad x>0. \]

其矩母函數為

\[m(t;\alpha,\beta)=\exp\left\{\alpha\left[1-\sqrt{1-\frac{2t}{\beta}}\right]\right\},\quad t\leq \frac\beta2. \]

注意:當 \(t\leq\dfrac\beta2\) 時,矩母函數存在;當 \(t>\dfrac\beta2\) 時,矩母函數不存在。

逆高斯分布來源於其累積量母函數是正態分布累積量母函數的反函數,逆高斯分布在壽命試驗、衛生科學、精算學、生態學、昆蟲學等眾多領域得到了極為廣泛的應用。

二、混合分布

指數混合分布:如果一個指數分布的參數是隨機的,分別以概率 \(q\)\(1-q\) 取值於 \(\alpha\)\(\beta\) ,則指數混合分布的密度函數為

\[p(x)=q\alpha e^{-\alpha x}+(1-q)\beta e^{-\beta x},\quad x>0. \]

對每個給定的 \(q\in[0,1]\) ,函數 \(p(\cdot)\) 是一個概率密度函數。

注意:指數分布和指數混合分布等在精算中主要是其理論上的意義,假設損失分布為指數分布,會產生很多良好的精算理論結果。

指數分布的組合:當 \(q<0\)\(q>1\) 時,

\[p(x)=q\alpha e^{-\alpha x}+(1-q)\beta e^{-\beta x},\quad x>0, \]

函數 \(p(\cdot)\) 有時仍然是一個概率密度函數,此時稱其為指數分布的組合。

例如:指數分布的組合,概率密度函數為

\[p(x)=2\left(e^{-x}-e^{-2x}\right)=2\times e^{-x}-1\times 2e^{-2x},\quad x>0 \]

即為 \(q=2\) 且參數 \(\alpha=1,\beta=2\) 的情況,容易驗證

\[\int_0^\infty p(x)\mathrm{d}x=2\int_0^\infty e^{-x}\mathrm{d}x-2\int_0^\infty e^{-2x}\mathrm{d}x=1. \]

混合分布的離散形式:設隨機變量 \(X_1,X_2,\cdots,X_n\) 相應的密度函數為 \(f_1(x),f_2(x),\cdots,f_n(x)\) 且定義在同一個概率空間。記隨機變量 \(Y\) 的密度函數為

\[f_Y(x)=p_1f_1(x)+p_2f_2(x)+\cdots+p_nf_n(x), \]

其中 \(p_i,i=1,2,\cdots,n\) 滿足

\[p_i\geq0,\quad i=1,2,\cdots,n,\quad \sum_{i=1}^np_i=1, \]

則稱隨機變量 \(Y\) 具有混合分布。

例如:設隨機變量 \(N\) 的概率分布列為 \(f_N(i)=p_i,i=1,2,\cdots,n\) ,隨機變量 \(X_1,X_2,\cdots,X_n\) 相應的密度函數為 \(f_1(x),f_2(x),\cdots,f_n(x)\) 且定義在同一個概率空間,記隨機變量 \(Y=X_N\) ,根據全概率公式有

\[f_Y(x)=p_1f_1(x)+p_2f_2(x)+\cdots+p_nf_n(x). \]

即此時的隨機變量 \(Y\) 具有混合分布。

一般混合分布形式:假設 \(\Lambda\) 是隨機變量,其支撐為 \(\Omega_\Lambda\) ,並且服從由參數 \(\theta\) 決定的密度函數 \(f_\Lambda(\lambda|\theta)\) 的分布。假設隨機變量 \(X\) 在給定 \(\Lambda=\lambda\) 的條件下,條件密度函數為 \(f_{X|\Lambda}(x|\lambda)\) 。記 \(Y\equiv X(\Lambda)|\theta\) 服從密度函數 \(f_Y(y|\theta)\) ,則有

\[\begin{aligned} f_Y(y|\theta)&=\frac{\mathrm{d}}{\mathrm{d}y}\mathrm{Pr}(X(\Lambda)\leq y|\theta) \\ \\ &=\int_{\Omega_\Lambda}\frac{\mathrm{d}}{\mathrm{d}y}\mathrm{Pr}(X(\Lambda)\leq y|\Lambda=\lambda) f_\Lambda(\lambda|\theta)\mathrm{d}\lambda \\ \\ &=\int_{\Omega_\Lambda}f_{X|\Lambda}(y|\lambda)f_\Lambda(\lambda|\theta)\mathrm{d}\lambda . \end{aligned} \]

引理:連續型隨機變量的全概率公式

設隨機變量 \((X,Y)\) 是二元隨機向量,隨機變量 \(Y\) 的分布函數為 \(F_Y(y)\) ,則

\[\mathrm{Pr}(X\leq x)=\int_{-\infty}^\infty\mathrm{Pr}(X\leq x|Y=y)\mathrm{d}F_Y(y). \]

\(f(x,y)\) 是二元可測函數,則

\[\mathrm{Pr}(f(X,Y)\leq z)=\int_{-\infty}^\infty\mathrm{Pr}(f(X,y)\leq z|Y=y)\mathrm{d}F_Y(y). \]

注意:這里密度函數 \(f_\Lambda(\lambda|\theta)\) 的寫法類似於貝葉斯統計中的寫法,在實際操作中 \(f_\Lambda(\lambda|\theta)\) 就是以 \(\theta\) 為參數的概率密度函數 \(f_\Lambda(\lambda;\theta)\)

例如:假設 \(X|\Lambda\sim \mathrm{Exp}(\Lambda)\) ,其中隨機參數 \(\Lambda\sim\Gamma(\alpha,\beta)\) ,試求 \(X\) 的分布。

:首先寫出 \(\Lambda\) 的密度函數

\[f_\Lambda(\lambda|\alpha,\beta)=\frac{1}{\Gamma(\alpha)\beta^\alpha}\lambda^{\alpha-1}e^{-\lambda/\beta},\quad \lambda>0. \]

由連續型隨機變量的全概率公式可得

\[\begin{aligned} f_X(x|\alpha,\beta)&=\int_0^\infty f_{X|\Lambda}(x|\lambda)f_{\Lambda}(\lambda|\alpha,\beta)\mathrm{d}\lambda \\ \\ &=\int_0^\infty \lambda e^{-\lambda x}\left[\frac{1}{\Gamma(\alpha)\beta^\alpha}\lambda^{\alpha-1}e^{-\lambda/\beta}\right]\mathrm{d}\lambda \\ \\ &=\frac{\alpha}{\beta^\alpha}\left[\frac{\beta}{\beta x+1}\right]^{\alpha+1} \\ \\ &\equiv\frac{\alpha\gamma^\alpha}{(x+\gamma)^{\alpha+1}} \quad (\gamma=1/\beta). \end{aligned} \]

\(X\) 服從 Pareto 分布,\(X\sim P(\alpha,\gamma)\)

三、保險領域中的混合分布

保險領域中的風險往往不是純連續或離散的隨機變量。許多被用來模擬保險理賠支付的隨機變量有連續增長的部分,也有離散的跳躍部分。這種分布的形式可以采用幾個常見分布的混合來構造。

假設 \(Z\) 是某個保單的理賠支付,\(X\) 是保單損失,兩者之間一般有如下三種情況:

  1. 保單損失 \(X\leq d\) ,則保單無理賠,因此 \(Z=0\) ,將 \(d\) 稱為免賠額;
  2. 保單損失 \(X>M+d\) ,按保單合同規定,支付最大的保險金額 \(M\) ,因此 \(Z=M\)
  3. 保單損失 \(d<X<M+d\) ,保單合同賠付在 \([0,M]\) 之間,因此 \(0<Z<M\)

注意:\(Z\) 的分布函數在 \(d\)\(M+d\) 處各有一個跳躍,中間部分常用一個連續分布函數表示理賠支付。

最常見的保險理賠分布為如下的形式:

\[Z=IX+(1-I)Y, \]

其中 \(I,X,Y\) 均為隨機變量:

  • \(Y\) 為連續型隨機變量,\(X\) 為離散型隨機變量;

  • \(I\) 為示性隨機變量,取值為 \(0\)\(1\) ,設事件發生的概率為 \(q=\mathrm{Pr}(I=1),0\leq q\leq1\)

  • \(I\)\(X,Y\) 相互獨立。

隨機變量 \(Z\)分布函數:由分布函數的定義計算得

\[\begin{aligned} F(z)&=\mathrm{Pr}(Z\leq z) \\ \\ &=\mathrm{Pr}(X\leq z,I=1)+\mathrm{Pr}(Y\leq z,I=0) \\ \\ &=q\mathrm{Pr}(X\leq z)+(1-q)\mathrm{Pr}(Y\leq z). \end{aligned} \]

\(X\) 為離散型隨機變量:

\[F(z)-F(z-0)=q\mathrm{Pr}(X=z), \]

其中 \(z\) 是隨機變量 \(X\) 的取值點,即 \(\mathrm{Pr}(X=z)>0\)

\(Y\) 為連續型隨機變量:

\[F'(z)=(1-q)\frac{\mathrm{d}}{\mathrm{d}z}\mathrm{Pr}(Y\leq z), \]

其中 \(z\) 不是隨機變量 \(X\) 的取值點,即 \(\mathrm{Pr}(X=z)=0\)

這種構造法產生的隨機變量 \(Z\) 的分布函數 \(F(z)\)\(z\) 處有跳躍,但 \(F(z)\) 不是一個階梯函數,在 \(Y\) 的值域上 \(F'(z)>0\)

隨機變量 \(Z\):假設 \(g(x)\) 是一個實值函數,記 \(g(Z)=g(IX+(1-I)Y)\) ,則有

\[\begin{aligned} \mathbb{E}\left[g(Z)\right]&=\mathrm{Pr}(I=1)\mathbb{E}\left[g(X)\right]+\mathrm{Pr}(I=0)\mathbb{E}\left[g(Y)\right] \\ \\ &=q\sum_{z}g(z)\mathrm{Pr}(X=z)+(1-q)\int_{-\infty}^\infty g(z)\left[\frac{\mathrm{d}}{\mathrm{d}z}\mathrm{Pr}(Y\leq z)\right]\mathrm{d}z \\ \\ &=\sum_{z}g(z)\left[F(z)-F(z-0)\right]+\int_{-\infty}^\infty g(z)F'(z)\mathrm{d}z \\ \\ &\equiv\int_{-\infty}^\infty g(z)\mathrm{d}F(z). \end{aligned} \]

這是一個黎曼-斯蒂爾切斯積分,其中 \(\mathrm{d} F(z)=F(z)-F(z-\mathrm{d}z)\) 表示 \(z\) 點的概率,即

  • 若有概率存在,則該微分 \(\mathrm{d} F(z)\) 表示分布函數在 \(z\) 點的跳躍高度;
  • 若在 \(z\) 處分布函數連續,則該微分 \(\mathrm{d} F(z)=F'(z)\mathrm{d}z\)

例如:假設風險 \(Z\) 有如下分布:

\[\begin{aligned} &\mathrm{Pr}(Z=0)=\frac12; \\ \\ &\mathrm{Pr}(Z\in[z,z+\mathrm{d}z))=\frac12\beta e^{-\beta z}\mathrm{d}z , \quad \beta=0.1, \quad z>0. \end{aligned} \]

計算隨機變量 \(Z\) 的分布函數和數學期望。

:索賠風險可以表示為 \(Z=IX+(1-I)Y\) ,其中:

  • \(X\) 為退化分布,\(X=0\)
  • \(Y\sim\mathrm{Exp}(0.1)\)
  • \(I\sim B(1,0.5)\) ,且與 \((X,Y)\) 獨立。

隨機變量 \(Z\) 的分布函數:對 \(\forall z>0\)

\[\begin{aligned} F_Z(z)&=\mathrm{Pr}(Z\leq z) \\ \\ &=\mathrm{Pr}(X\leq z,I=1)+\mathrm{Pr}(Y\leq z,I=0) \\ \\ &=\frac12\left[\mathrm{Pr}(X\leq z)+\mathrm{Pr}(Y\leq z)\right] \\ \\ &=\frac12\left(1+(1-e^{-\beta z})\right) \\ \\ &=1-\frac12 e^{-\beta z}. \end{aligned} \]

隨機變量 \(Z\) 的數學期望:

\[\begin{aligned} \mathbb{E}(Z)&=\mathbb{E}\left[IX+(1-I)Y\right] \\ \\ &=\mathbb{E}(X)\mathbb{E}(I)+\mathbb{E}(Y)\mathbb{E}(1-I) \\ \\ &=0\times0.5+\frac1\beta\times0.5 \\ \\ &=5. \end{aligned} \]

例如:考慮承包責任損失為 \(S\) 的保單,計算理賠支付 \(X\) 的分布,其中 \(X\) 的給付規則為

\[X=\left\{\begin{array}{ll} 0 , & S\leq 100, \\ S-100 , & 100<S\leq 1100, \\ 1000, &S\geq1100. \end{array}\right. \]

隨機變量 \(S\) 的分布為

\[\begin{aligned} &\mathrm{Pr}(S\leq 100)=0.9 , \quad \mathrm{Pr}(S>100)=0.1; \\ \\ &\mathrm{Pr}(S\leq 100)=0.02. \end{aligned} \]

\((100,1100)\) 上,\(S\) 服從均勻分布。

:考慮 \(X=IB\) ,其中 \(I\) 為示性變量,滿足

\[\mathrm{Pr}(I=0)=0.9 , \quad \mathrm{Pr}(I=1)=0.1 . \]

在有索賠發生時,賠付額的分布為

\[\begin{aligned} &\mathrm{Pr}(B=1000|I=1)=0.2 , \\ \\ &\mathrm{Pr}(B<x|I=1)=0.8\times\frac{1}{1000}x , \quad 0<x<1000. \end{aligned} \]

所以 \(X\) 的分布函數為

\[\begin{aligned} F_X(x)&=\mathrm{Pr}(X\leq x)=\mathrm{Pr}(IB\leq x) \\ \\ &=\mathrm{Pr}(IB\leq x|I=0)\mathrm{Pr}(I=0)+\mathrm{Pr}(IB\leq x|I=1)\mathrm{Pr}(I=1) \\ \\ &=0.9\times\mathrm{Pr}(0\leq x)+0.1\times\mathrm{Pr}(B\leq x) \\ \\ &=\left\{\begin{array}{ll} 0.9\times 0+0.1\times0 , &x<0 , \\ 0.9\times 1+0.1\times8x\times10^{-4} , & 0\leq x<1000, \\ 0.9\times 1+0.1\times1 , & x\geq1000. \end{array}\right. \\ \\ &=\left\{\begin{array}{ll} 0 , &x<0 , \\ 0.9+8x\times10^{-5} , & 0\leq x<1000, \\ 1 , & x\geq1000. \end{array}\right. \end{aligned} \]

這里我們對 \(X\) 的分布的實際意義加以說明:

  • 沒有索賠的概率為 \(90\%\)
  • 索賠額為 \(1000\) 的概率為 \(2\%\)
  • 索賠額在 \([0,1000]\) 之間的概率為 \(8\%\)

四、產生新分布的一些方法

(1) 隨機變量的變換

以對數正態分布為例。假設 \(X\sim N(\mu,\sigma^2)\) ,作指數變換 \(Y=e^X\) ,即 \(X=\log(Y)\) ,得到 \(Y\) 的概率密度函數為

\[f_Y(y)=\frac{1}{\sqrt{2\pi}\sigma}\exp\left\{-\frac{(\log(y)-\mu)^2}{2\sigma^2}\right\}\frac1y, \quad y>0. \]

隨機變量 \(Y\) 的分布稱為對數正態分布,記為 \(Y\sim LN(\mu,\sigma^2)\)

(2) 拼接

假設 \(f_1(x),f_2(x),\cdots,f_k(x)\)\(k\) 個密度函數,定義一個新的密度函數

\[f_X(x)=\left\{\begin{array}{ll} p_1f_1^*(x), & x\in[0,c_1), \\ p_2f_2^*(x), & x\in[c_1,c_2), \\ \quad \vdots & \quad \vdots \\ p_kf_k^*(x), & x\in[c_{k-1},\infty), \end{array}\right. \]

其中

\[\begin{aligned} &p_i\geq0,\quad i=1,2,\cdots,k,\quad \sum_{i=1}^kp_i=1, \\ \\ &0=c_0<c_1<c_2<\cdots<c_{k-1}<c_k=\infty, \end{aligned} \]

並且 \(f_i^*(x)\) 是密度函數 \(f_i(x)\) 在區間 \([c_{i-1},c_i),i=1,2,\cdots,k\) 之間按如下公式調整之后的部分:

\[f_i^*(x)=\frac{f_i(x)}{\int_{c_{i-1}}^{c_i}f_i(x)\mathrm{d}x} , \quad x\in [c_{i-1},c_i). \]

例如:假設 \(X_1\sim\mathrm{Exp}(0.5),\ X_2\sim\mathrm{Exp}(2),\ X_3\sim P(2,3)\) ,相應的密度函數分別記為 \(f_i(x),i=1,2,3\) 。按如下方式進行拼接:

\[p_1=p_2=p_3=\frac13 , \\ \\ f_X(x)=\left\{\begin{array}{ll} \dfrac13f_1^*(x) , &x\in[0,1) , \\ \dfrac13f_2^*(x) , &x\in[1,3) , \\ \dfrac13f_3^*(x) , &x\in[3,\infty) . \end{array}\right. \]

經計算得

\[\begin{aligned} &\int_0^1f_1(x)\mathrm{d}x=\int_0^10.5e^{-0.5x}\mathrm{d}x=0.3935, \\ \\ &\int_1^3f_2(x)\mathrm{d}x=\int_1^32e^{-2x}\mathrm{d}x=0.2699, \\ \\ &\int_3^\infty f_3(x)\mathrm{d}x=\left(\frac{3}{3+3}\right)^2=0.25. \end{aligned} \]

由拼接得到的密度函數為

\[f_X(x)=\left\{\begin{array}{ll} 0.4235\times e^{-0.5x} , &x\in[0,1) , \\ \\ 2.4701\times e^{-2x} , &x\in[1,3) , \\ \\ \dfrac{24}{(x+3)^3} , &x\in[3,\infty) . \end{array}\right. \]


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM