概率的公理化定義
為了准確理解與深入研究隨機現象,我們不能滿足於從直覺出發形成的概率定義(概率的穩定值或可能性大小的個人信念),必須把概率論建立在堅實的數學基礎上,科爾莫哥洛夫1933年在《概率論基本概念》一書中用集合論觀點和功利化方法成功解決了這個問題。
首先,可以看到事件的關系和集合關系之間存在着重要的聯系。我們給出兩者之間的對應關系,之后對於事件的研究就轉化為對集合的研究。
- 條件 S 下的「事件」就是若干個結果的集合(即 \(\Sigma\) 的子集),所謂觀察到事件 A 發生就是指 S 下出現的結果屬於 A 。顯然,\(\Sigma\) 本身是必然事件,空集 \(\varnothing\) 是不可能事件。
- 如果\(A\in \Sigma\),則\(A^c=\Omega -A\)就是 A 的對立事件 \(\bar{A}\)。
- 所謂 A 與 B 不相容就是指\(A\cap B= \varnothing\)(即A與B不相交)。
- 事件的並和交分別歸結為集合的並和交。
\(\Sigma\) 是任意的非空集合,叫作基本事件空間(樣本空間),其背景是條件 S 下所有可能的不同結果的全體(每個結果是一個「基本事件」)
定義1: 設 \(\mathcal{F}\) 是由 \(\Sigma\) 的一些子集組成的集合(這種由集合組成的集合一般叫作集合系),\(P=P(\cdot)\) 是 \(\mathcal{F}\) 上有定義的實值函數。如果定義域 \(\mathcal{F}\) 和函數 P 滿足下列條件:
- $\Omega\in\mathcal{F} $
- 若$A \in\mathcal{F} \(,則\)A^c=\Omega-A \in\mathcal{F}$
- 若\(A_n \in\mathcal{F} (n=1,2,...)\),則 $\bigcup_{n=1}^\infty A_n \in\mathcal{F} $
- \(P(A)\ge 0 (A\in \mathcal{F} )\)
- \(P(\Omega)=1\)
- 若\(A_n \in\mathcal{F} (n=1,2,..)\)且兩兩不相交,則\(P(\bigcup_{n=1}^\infty A_n)=\sum_{n=1}^\infty P(A_n)\)
那么稱 \(P\) 是 \(\mathcal{F}\) 上的概率測度(簡稱概率),\( P(A)\) 為 \(A\) 的概率(也稱 \(A\) 發生的概率)。附有 \(\mathcal{F}\) 和 \(P\) 的 \(\Omega\) 叫作概率空間,有時也說 \((\Omega, \mathcal{F}, P)\) 是概率空間。
定義2: 設 \(\mathcal{F}\) 是由 \(\Omega\) 的一些子集組成的集合,具有上述 1-3 的性質,則稱 \(\mathcal{F}\) 是 \(\Omega\) 中的 \(\sigma\) 域(或 \(\sigma\) 代數)。
其中前三條構成的集合稱為 \(\sigma\) 域;而后三條,即非負性、完全性、可列可加性則是概率的公理化定義。
補充定義(測度):設\(\mathcal{F}\)是由\(\Omega\)的一些子集組成的集合,\(\varnothing\in\mathcal{F}\),稱\(\mathcal{F}\)上有定義的函數\(\mu=\mu(\cdot)\)為測度,如果它滿足:
- \(0\le\mu(A)\le+\infty\)
- \(\mu(\varnothing)=0\)
- 若\(A_n \in\mathcal{F} (n=1,2,...)\)兩兩不相交且 \(\bigcup_{n=1}^\infty A_n\in\mathcal{F}\),則\(\mu(\bigcup_{n=1}^\infty A_n)=\sum_{n=1}^\infty \mu(A_n)\)
可以看到,我們定義的概率測度是一種特殊的測度。
任意指定非空集合 \(\Omega\) 及 \(\Omega\) 中的一些子集組成的 \(\sigma\) 域 \(\mathcal{F}\) 以及\(\mathcal{F}\) 上有定義的概率 P ,所得到的三元組 \((\Omega, \mathcal{F}, P)\) 是我們研究概率的基礎和出發點。
- (前三條)首先指出,\(\sigma\) 域 \(\mathcal{F}\) 關於集合的基本運算是「封閉」的。即,任意個數(有限、可數)集合的交/並仍屬於\(\mathcal{F}\),兩集合之差也屬於\(\mathcal{F}\)。
- (后三條)其次,經由上述定義在 \(\sigma\) 域 \(\mathcal{F}\) 上的概率函數 P 有一系列的性質(在此省略)。
隨機變量的概念
注意到,隨機變量是概率論乃至統計學的核心概念之一,因此以下對這一概念進行進一步的闡釋。
在《概率與統計》中,對於隨機變量有兩種定義(后者更為完全)
定義1: 如果條件 S 下所有可能的結果組成集合 \(\Omega=\{\omega\}\), \(X=X(\omega)\) 是 \(\Omega\) 上有定義的實值函數,而且對任何實數 c,事件\(\{\omega: X(\omega)\le c\}\) 是有概率的,則稱 X 是隨機變量。
定義2: 設\((\Omega, \mathcal{F}, P)\)是概率空間, \(X=X(\omega)\)是\(\Omega\) 上有定義的實值函數,如果對任何實數x,集合\(\{\omega: X(\omega)\le x\}\) 屬於\(\mathcal{F}\),則稱X是\((\Omega, \mathcal{F}, P)\)上的隨機變量。
包含兩個方面的內容:
- 隨機變量 \(X=X(\omega)\) 是基本事件 \(\omega\) 的函數,它體現隨機而變
- 雖然\(X=X(\omega)\) 的值不能預先確定(因為無法預料將出現什么樣的 \(X=X(\omega)\) ,但是對給定的 x,事件\(\{\omega: X(\omega)\le x\}\) 是有確定概率的,這體現了隨機變量的一種「規則性」
最后,給出 wiki 上的定義作為參考:
A random variable is a measurable function \(X: \Omega\rightarrow E\) from a set of possible outcomes \(\Omega\) to a measurable space \(E\). The technical axiomatic definition requires \(\Omega\) to be a sample space of a probability triple (see the measure-theoretic definition).
The probability that \(X\) takes on a value in a measurable set \({\displaystyle S\subseteq E}\) is written as
\({\displaystyle \operatorname {P} (X\in S)=\operatorname {P} (\{\omega \in \Omega \mid X(\omega )\in S\})}\),
where ${\displaystyle \operatorname {P} } $ is the _probability measure_on \({\displaystyle (\Omega ,{\mathcal {F}})}\).
在這樣嚴格定義的隨機變量的概念下,用分布函數來刻畫隨機變量的概率特性:
定義:設 \(X=X(\omega)\)是隨機變量,稱函數
為 \(X\) 的分布函數,有時記為 \(F_X(x)\)。
由此定義的分布函數有以下三條性質
- 單調性:若\(a<b\),則 \(F(a)\le F(b)\)
- \(\underset{x\rightarrow -\infty}{lim}F(x)=0, \underset{x\rightarrow +\infty}{lim}F(x)=1\)
- 右連續性:\(\underset{\delta\rightarrow 0+}{lim}F(x+\delta)=F(x)\)
后兩條的證明可考慮事件並公式,注意到右連續性是從分布函數的定義推導出來的,在此基礎上,有
- \(F(X<x)=F(x-0)\)
- \(F(a<X\le b)=F(b)-F(a)\)
- \(F(a\le X\le b)=F(b)-F(a)-0\)
- \(F(a<X< b)=F(b-0)-F(a)\)
