和其它問題一樣,概率也可能同時受到多個條件的影響,例如考察某地區中學生的身體素質,隨機地選取一名學生,觀察學生的身高 X,體重 Y 和肺活量 Z 等指標。隨機變量 X,Y,Z 來自同一樣本空間,它們的取值可能相互影響。像這樣同時考慮的多個隨機變量,稱為多維隨機變量。本章以二維隨機變量為例,介紹多維隨機變量的相關概念。
聯合分布
和一維變量的概率分布類似,聯合分布把舞台擴展到了多維,這里的“聯合”就是多個隨機變量的意思。
假設一個事件受到兩個變量x和y的影響,它的聯合分布定義為:
其中X表示具體的取值,x表示變量。
上一章提到過,分布是指概率的累加,是把事件映射為數字,一個二維聯合分布的變量取值范圍是整個二維平面,但F(x,y)的取值范圍是0~1。
離散型
聯合概率
聯合概率指的是包含多個條件且所有條件同時成立的概率,也叫聯合分布率。
用xi和yj的兩個隨機變量所有可能的取值,P(X=xi, Y=yj)表示在X=xi和Y=yj下事件發生的概率。設P(X=xi, Y=yj)=pij,則下表是二維離散型隨機變量(X, Y)的聯合概率:
聯合分布率實際上是一個矩陣。既然是概率,聯合概率也滿足下面兩個條件:
聯合分布
一維隨機變量的分布函數:
二維隨機變量的分布函數:
其中:
分布函數和分布略有區別,“分布”是指累加概率,“分布函數”是將累加概率函數化。F(x,y)=P{X≤x,Y≤y}是分布函數,它的值是所有在X≤x,Y≤y下的概率分布。
邊緣分布
先看表1的第一行,它固定了x=x1,此時在表格右側加入一列:
p1·表示x的取值固定,y取任意值時的概率分布,即:
由於p1·是寫在表格的邊緣,所以稱為x=x1的邊緣分布。對於任意行來說:
這實際上是在表示X= xi時事件發生的概率。類似的,y=yj的邊緣分布是:
條件概率
條件概率是指在A事件發生的條件下,事件B發生的概率,表示為P(B|A),它有一個重要公式:
多維隨機變量的條件概率公式與此類似,在Y=yj 條件下X=xi的概率:
獨立性
對於二維離散型隨機變量(X, Y)來說,如果滿足:
那么這兩個隨機變量之間是沒有相互影響的,稱X和Y之間互相獨立。反過來也一樣,如果滿足了獨立性,那么必然有上式的關系。
連續型
由於是連續型變量,所以無法像離散型變量那樣簡單地計算在某一點的概率(概率可以表示為幾何度量,點的度量是0,因此算某一點的概率也是0,或者說計算點的概率沒有意義),只能計算某一取值范圍內的概率,也就是概率分布(概率的累加)。
聯合概率密度函數和聯合分布
某個地區的人口密度越大,這個地區的人口越多。同樣的,概率密度越大,說明這個區域的發生某件事的概率越大。
設F(x,y)是二維連續型隨機變量(X,Y)的聯合分布函數,如果存在一個非負函數f(x,y),對於任意實數x,y,有:
則稱f(x,y)是二維連續型隨機變量(X,Y)的聯合概率密度函數。
u和v在計算后定積分后會被x和y代替。可以對比上一章中一維隨機變量的分布函數來理解F(x,y)。概率分布是概率的累加,而累加正好是積分的定義。在幾何上,F(x,y)表示了曲面柱體的體積:
假設在R區域上,x1<x<x2, y1<y<y2,那么該區域上的概率分布是:
dydx是R上的面積積元,它是面積無限接近0的小矩形,但不是0。至此,概率和多重積分聯系到一起。上式中沒有u和v,這是由於已經確定了x和y的取值范圍,且f本來就是關於x和y的函數,因此沒必要再引入u和v。如果非要使用u和v,那么上式等價於:
由於F是分布函數,因此在整個定義域上滿足:
邊緣分布和邊緣密度函數
聯合分布表達的是二維隨機變量(X, Y)的整體分布,同時X和Y也有各自的邊緣分布。與離散型類似,連續型隨機變量的邊緣分布是只認為有一個變量,其它變量都看作常量。
X的邊緣分布,表示將x看作常量,不管Y的取值:
Y的邊緣分布,表示將y看作常量,不管x的取值:
設(X, Y)的聯合密度函數是f(x,y),那么(X, Y)的聯合分布可以表示為:
X的邊緣分布限定了X的取值是X≤x,y可以取任意值,此時X的邊緣分布可以寫成:
分布代表了累加,連續型分布是用積分表示的,FX(x)表示P{X≤x, Y<∞}的累加,是對dx的積分,因此X的邊緣分布的密度函數是上式的內積分:
把u,v換成x,y,X的邊緣分布的密度函數是:
類似的,Y的邊緣分布的密度函數是:
條件分布和條件密度函數
條件概率公式:
對於連續型變量來說,單點的概率沒有意義,因此將上式推廣到連續型隨機變量后就變成了“分布”,比如給定Y值的條件下X的概率分布。
設(X, Y)的聯合密度函數是f(x,y),邊緣密度函數是fX(x)和fY(y),如果固定x,則稱下式為X=x條件下Y的概率密度:
同樣,Y=y條件下X的概率密度:
有了概率密度,自然可以求得相應的分布,給定Y值的條件下X的概率分布:
獨立性
對於二維連續型隨機變量(X, Y)來說,如果滿足:
那么這兩個隨機變量之間是沒有相互影響的,稱X和Y之間互相獨立。反過來也一樣,如果滿足了獨立性,那么必然有上式的關系。
二維均勻分布
設R是平面上的有界區域,面積為A,若二維隨機變量(X,Y)具有概率密度:
則稱(X, Y)在R上服從均勻分布。
如果在R區域上x在x1<x<x2上服從均勻分布,那么X在x1<x<x2的邊緣分布的密度函數是:
若(X, Y) 服從R區域上的均勻分布,則對於R上的任一子區域D,都有:
上式實際上是在說,如果(X,Y)在某個區域內服從均勻分布,則意味着(X,Y)在該區域內具有“等可能”性。
二維正態分布
若二維隨機變量(X,Y)具有概率密度:
則稱(X,Y)服從參數為 的二維正態分布,記作:
f(x,y)的是一個倒鍾型曲面:
示例
示例1
X服從(0,1)上的均勻分布,在X=x(0<x<1)的條件下,Y在(0,x)內服從均勻分布,f(x,y)=?, 2. fY(y)=?
先看1,X服從某一個區域的邊緣分布意味着:
X服從(0,1)上的均勻分布,則x1 = 0, x2 = 1:
“Y在(0,x)內服從均勻分布”:
2. Y的邊緣分布的密度函數是:
現在只需要確定的積分域即可,由0<y<x<1可知,積分上限是1,下限是y:
示例2
設二維隨機變量(X, Y)的聯合概率密度是:
1. A=? 2.求分布函數F(x,y) 3.求概率P{Y≤X}
1. 整個定義域上分布函數滿足:
作者:我是8位的