概率筆記6——多維隨機變量


  和其它問題一樣,概率也可能同時受到多個條件的影響,例如考察某地區中學生的身體素質,隨機地選取一名學生,觀察學生的身高 X,體重 Y 和肺活量 Z 等指標。隨機變量 X,Y,Z 來自同一樣本空間,它們的取值可能相互影響。像這樣同時考慮的多個隨機變量,稱為多維隨機變量。本章以二維隨機變量為例,介紹多維隨機變量的相關概念。

聯合分布

  和一維變量的概率分布類似,聯合分布把舞台擴展到了多維,這里的“聯合”就是多個隨機變量的意思。

  假設一個事件受到兩個變量x和y的影響,它的聯合分布定義為:

  其中X表示具體的取值,x表示變量。

  上一章提到過,分布是指概率的累加,是把事件映射為數字,一個二維聯合分布的變量取值范圍是整個二維平面,但F(x,y)的取值范圍是0~1。

離散型

聯合概率

  聯合概率指的是包含多個條件且所有條件同時成立的概率,也叫聯合分布率。

  用xi和yj的兩個隨機變量所有可能的取值,P(X=xi, Y=yj)表示在X=xi和Y=yj下事件發生的概率。設P(X=xi, Y=yj)=pij,則下表是二維離散型隨機變量(X, Y)的聯合概率:

  聯合分布率實際上是一個矩陣。既然是概率,聯合概率也滿足下面兩個條件:

聯合分布

  一維隨機變量的分布函數:

  二維隨機變量的分布函數:

  其中:

  分布函數和分布略有區別,“分布”是指累加概率,“分布函數”是將累加概率函數化。F(x,y)=P{X≤x,Y≤y}是分布函數,它的值是所有在X≤x,Y≤y下的概率分布。

邊緣分布

  先看表1的第一行,它固定了x=x1,此時在表格右側加入一列:

  p1·表示x的取值固定,y取任意值時的概率分布,即:

  由於p1·是寫在表格的邊緣,所以稱為x=x1的邊緣分布。對於任意行來說:

  這實際上是在表示X= xi時事件發生的概率。類似的,y=yj的邊緣分布是:

條件概率

  條件概率是指在A事件發生的條件下,事件B發生的概率,表示為P(B|A),它有一個重要公式:

  多維隨機變量的條件概率公式與此類似,在Y=yj 條件下X=xi的概率:

獨立性

  對於二維離散型隨機變量(X, Y)來說,如果滿足:

  那么這兩個隨機變量之間是沒有相互影響的,稱X和Y之間互相獨立。反過來也一樣,如果滿足了獨立性,那么必然有上式的關系。

連續型

  由於是連續型變量,所以無法像離散型變量那樣簡單地計算在某一點的概率(概率可以表示為幾何度量,點的度量是0,因此算某一點的概率也是0,或者說計算點的概率沒有意義),只能計算某一取值范圍內的概率,也就是概率分布(概率的累加)。

聯合概率密度函數和聯合分布

  某個地區的人口密度越大,這個地區的人口越多。同樣的,概率密度越大,說明這個區域的發生某件事的概率越大。

  設F(x,y)是二維連續型隨機變量(X,Y)的聯合分布函數,如果存在一個非負函數f(x,y),對於任意實數x,y,有:

  則稱f(x,y)是二維連續型隨機變量(X,Y)的聯合概率密度函數。

  u和v在計算后定積分后會被x和y代替。可以對比上一章中一維隨機變量的分布函數來理解F(x,y)。概率分布是概率的累加,而累加正好是積分的定義。在幾何上,F(x,y)表示了曲面柱體的體積:

  假設在R區域上,x1<x<x2, y1<y<y2,那么該區域上的概率分布是:

  dydx是R上的面積積元,它是面積無限接近0的小矩形,但不是0。至此,概率和多重積分聯系到一起。上式中沒有u和v,這是由於已經確定了x和y的取值范圍,且f本來就是關於x和y的函數,因此沒必要再引入u和v。如果非要使用u和v,那么上式等價於:

  由於F是分布函數,因此在整個定義域上滿足:

邊緣分布和邊緣密度函數

  聯合分布表達的是二維隨機變量(X, Y)的整體分布,同時X和Y也有各自的邊緣分布。與離散型類似,連續型隨機變量的邊緣分布是只認為有一個變量,其它變量都看作常量。

  X的邊緣分布,表示將x看作常量,不管Y的取值:

  Y的邊緣分布,表示將y看作常量,不管x的取值:

  設(X, Y)的聯合密度函數是f(x,y),那么(X, Y)的聯合分布可以表示為:

  X的邊緣分布限定了X的取值是X≤x,y可以取任意值,此時X的邊緣分布可以寫成:

  分布代表了累加,連續型分布是用積分表示的,FX(x)表示P{X≤x, Y<∞}的累加,是對dx的積分,因此X的邊緣分布的密度函數是上式的內積分:

  把u,v換成x,y,X的邊緣分布的密度函數是:

  類似的,Y的邊緣分布的密度函數是:

條件分布和條件密度函數

  條件概率公式:

  對於連續型變量來說,單點的概率沒有意義,因此將上式推廣到連續型隨機變量后就變成了“分布”,比如給定Y值的條件下X的概率分布。

  設(X, Y)的聯合密度函數是f(x,y),邊緣密度函數是fX(x)和fY(y),如果固定x,則稱下式為X=x條件下Y的概率密度:

  同樣,Y=y條件下X的概率密度:

  有了概率密度,自然可以求得相應的分布,給定Y值的條件下X的概率分布:

獨立性

  對於二維連續型隨機變量(X, Y)來說,如果滿足:

  那么這兩個隨機變量之間是沒有相互影響的,稱X和Y之間互相獨立。反過來也一樣,如果滿足了獨立性,那么必然有上式的關系。

二維均勻分布

  設R是平面上的有界區域,面積為A,若二維隨機變量(X,Y)具有概率密度:

  則稱(X, Y)在R上服從均勻分布。

  如果在R區域上x在x1<x<x2上服從均勻分布,那么X在x1<x<x2的邊緣分布的密度函數是:

  若(X, Y) 服從R區域上的均勻分布,則對於R上的任一子區域D,都有:

  上式實際上是在說,如果(X,Y)在某個區域內服從均勻分布,則意味着(X,Y)在該區域內具有“等可能”性。

二維正態分布

  若二維隨機變量(X,Y)具有概率密度:

  則稱(X,Y)服從參數為 的二維正態分布,記作:

  f(x,y)的是一個倒鍾型曲面:

示例

示例1

  X服從(0,1)上的均勻分布,在X=x(0<x<1)的條件下,Y在(0,x)內服從均勻分布,f(x,y)=?, 2. fY(y)=?

  先看1,X服從某一個區域的邊緣分布意味着:

  X服從(0,1)上的均勻分布,則x1 = 0, x2 = 1:

  “Y在(0,x)內服從均勻分布”:

  

  2. Y的邊緣分布的密度函數是:

  現在只需要確定的積分域即可,由0<y<x<1可知,積分上限是1,下限是y:

示例2

  設二維隨機變量(X, Y)的聯合概率密度是:

  1. A=? 2.求分布函數F(x,y) 3.求概率P{Y≤X}

  

  1. 整個定義域上分布函數滿足:


  作者:我是8位的

  出處:http://www.cnblogs.com/bigmonkey

  本文以學習、研究和分享為主,如需轉載,請聯系本人,標明作者和出處,非商業用途! 

  掃描二維碼關注公眾號“我是8位的”


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM