1 定義
依分布收斂的定義是這樣的:隨機變量序列\(\{X_n\}_{n=1}^{\infty}\),若它們的累積分布函數cdf序列\(\{F_1\}_{n=1}^{\infty}\),與某個隨機變量\(X\)的cdf \(F\),滿足
在任意\(F(x)\)的連續點\(x\)處都成立。則稱它們依分布收斂到隨機變量\(X\),記為\(X_n\stackrel{D}\longrightarrow X\)。
在這個定義中,有兩個極易忽視但又重要的點,一是必須要對應到某個隨機變量的cdf,而不是任意一個函數,二是只要求在\(F(x)\)的連續點處條件成立即可。
接下來,我們分析為何要如此定義。
2 極限函數必須是cdf
考慮\(X_n\sim N(0,\sigma_n^2)\),\(\sigma_n\to +\infty\),我們有
在任一點\(x\)處,都有\(\Phi(\dfrac{x}{\sigma_n})\to\Phi(0)=\dfrac{1}{2}\),因此,可設\(F(x)=\dfrac{1}{2}\),就滿足定義中的極限條件。但此時,\(F(x)\)不是任何隨機變量的cdf,因為隨機變量的cdf需要滿足\(\lim\limits_{x\to -\infty}F(x)=0\)以及\(\lim\limits_{x\to \infty}F(x)=1\)。
這一點如何修正?我們只需讓序列\(\{X_n\}_{n=1}^{\infty}\)是依概率有界即可。而在定義中,就要求cdf函數列的極限形式,一定要對應到某個隨機變量的cdf。
3 只考慮連續點
回憶cdf的另一個性質:右連續,即\(F(x)=F(x+)\)。但在依分布收斂的情形中,很可能會出現不滿足的情況,如\(X_n=X+\dfrac1 n\),易知
若\(n\to\infty\),則\(F_n(x)\to F(x-)\)。若\(F\)在\(x\)處不滿足左連續,那么不能滿足\(F_n(x)\to F(x)\),因此在定義中,需將\(F\)的不連續點排除。
舉個具體的例子,如\(X_n\sim U_{(0,1/n)}\),則\(X_n\)在極限時的分布會退化為\(X=1\),而\(F_n(0)=0\)恆成立,但\(F(0)=1\),因此對於\(x=0\)無法滿足\(F_n(x)\to F(x)\),但\(x=0\)是\(F(x)\)的不連續點,因此可以剔除。所以還是認為\(X_n\stackrel{D}\longrightarrow X\)。