《概率統計》2.離散型隨機變量:分布與數字特征


從事件到隨機變量

我們可以把某一次具體試驗中所有可能出現的結果構成一個樣本空間,對於樣本空間中的每一個可能的試驗結果,我們去將他關聯到一個特定的數。這種試驗結果與數的對應關系就形成了隨機變量,將試驗結果所對應的數稱為隨機變量的取值。這里就是接下來要討論的重要內容。

請注意這個概念中的一個關鍵點,隨機變量如何取值?他可以直接就是試驗的結果取值,比如“拋擲骰子的結果點數為 5”。

但是,隨機變量更多的是這種情況,比如隨機變量可以是“連續拋擲硬幣 10 次,其中硬幣正面出現的次數”,或者是映射值:我們把骰子連續拋擲兩次,隨機變量對應連續兩次試驗中的最大值或者點數之和,這就是映射的情況。但是無論如何,對於隨機變量,都必須要明確對應具體的取值。

離散型隨機變量及其要素

很容易聯想到,隨機變量作為一種映射后的取值,本質上和函數取值一樣,可以有連續型和離散型兩種,在這一篇博客里,我們主要討論離散型的情況和應用場景,連續型的情況放在下一篇來講解。

對於連續和離散的概念,大家腦海里的直觀印象往往更加簡單,但具體怎么用形式化的概念語言來描述他,反而要更繁瑣一些。我們還是嚴格的對離散型隨機變量做一個定義,即:隨機變量的取值只能是有限多個或者是可數的無限多個值

那么對於任意的我們獲取的一組隨機變量,最關注的是哪些要素呢?我們來列舉一下:

第一:隨機變量的取值。 顯然這個是我們首先需要關注的,由試驗結果派生出的這一組隨機變量到底能取到哪些值,這是我們首要關注的問題點。

第二:試驗中每個對應取值的概率。 每個事件的結果肯定不是等概率的,這也恰恰就是我們研究的出發點。

第三:隨機變量的統計特征和度量方法。 弄清楚隨機變量每一個具體的取值,我們把握的是他的個體特征,那么如何從整體上來把握這一組隨機變量的統計特征呢?這也是非常重要的。

結合三個問題,來討論一下離散型隨機變量的分布

分布列描述的就是離散型隨機變量每一種取值及其對應的概率,隨機變量一般用大寫字母表示,其具體的取值一般用小寫字母來表示。例如,隨機變量X的分布列,我們一般用PX來表示,而x來表示隨機變量X的某個具體的取值,因此把上述信息結合起來就有:

隨機變量 X 取值為 x 的概率,本質上也是一個事件的概率,這個事件就是 {X=x},我們將他記作:PX(x)或者P({X=x})

為了更清楚的解釋這個式子,我們還是回到拋硬幣這個最簡單的情況中來。隨機變量 X 表示兩次拋擲硬幣正面向上的次數,隨機變量 X 的分布列如下表所示:

從上面的隨機變量分布列中我們可以清晰地看出隨機變量 X 的每一種取值以及所對應的取值概率。例如,正面向上的次數為 1 時,對應的事件概率為 1/2。這個分布列雖然非常簡單,但是麻雀雖小五臟俱全,下面我們來重點關注里面最重要的兩個要點。

第一,對於隨機變量 X 的所有可能取值,其概率之和為 1,表示成表達式就是:∑xPX(x) = 1

第二,對於隨機變量 X 的不同取值 x,對應的事件 {X=x} 彼此之間是互不相容的。因此多個事件構成的事件集合 S 的發生概率,可以通過對應事件發生的概率直接相加得到。即:P(X ∈ S)=∑x∈SPx(x)

舉個例子:比如我們想計算一下連續兩次拋擲硬幣,出現正面向上的概率為多大,這個事件集合實際上包含了兩個事件:事件 1 是 {X=1},事件 2 是 {X=2},二者彼此是互不相容的,我們按照上面的式子可以得出其概率:P(X > 0) = PX(1) + PX(2) = 3 / 4

分布列和概率質量函數(PMF)

一般情況下,我們最好是結合圖形來觀察一個隨機變量的分布,這樣一來,他的特性就能夠非常直觀的展現出來。

這里,就不得不提一下概率質量函數(PMF),概率質量函數就是將隨機變量的每個值映射到其概率上,看上去和分布列就是一回事兒。

二項分布及二項隨機變量

我們還是舉拋硬幣的例子:將一個硬幣拋擲 n 次,每次拋擲出現正面的概率為 p,每次拋擲彼此之間都是相互獨立的,隨機變量 X 對應 n 次拋擲中、得到的是正面的次數。

這里,隨機變量 X 服從二項分布(結果要么發生、要么不發生),二項分布中的核心參數就是上面提到的 n 和 p,隨機變量的分布列可以通過下面這個熟悉的公式計算得到:

Px(k) = \(c_{n}^{k}\)pk(1-p)n-k,其中k為拋擲n次硬幣、結果出現的是正面的次數,顯然k=0,1,2...n

服從二項分布的隨機變量,他的期望和方差的表示很簡單,服從參數為 (n,p) 的二項分布的隨機變量 X,他的期望和方差的公式我們直接給出來:

期望:E(X) = np

方差:V(X) = np(1 - p)

幾何分布與幾何隨機變量

我們在二項分布的基礎上再來介紹幾何分布,在連續拋擲硬幣的試驗中,每次拋擲出現正面的概率為 p,出現反面的概率為 1−p,在這種背景下,幾何隨機變量 X 就用來表示連續拋擲硬幣直到第一次出現正面所需要的拋擲次數。

或者我們再舉一個直白點的例子,學校里有 10 個白富美女生(假定她們互相不認識,保證獨立性),你依次去找她們表白,只要有一個成功了,你就結束了單身狗的日子。但是表白成功的概率為 p,當然,成功的概率肯定不大,但是你秉持着死皮賴臉、死纏爛打,不成功誓不罷休的精神,只要女神拒絕你的表白,就換一個女神繼續表白,直到某一個女神答應你為止,那么你一共表白過的總的次數,就是幾何型的隨機變量。

總結一下,幾何分布的期望和方差分別為:

  • E(X) = 1 / p
  • V(X) = (1 - p) / p2

泊松分布及泊松隨機變量

首先我們提一下什么是伯努利試驗:在同樣的條件下、相互獨立地進行的一種隨機試驗就叫做伯努利試驗,其特點就是實驗結果是有兩種可能:發生或者不發生。我們假設該試驗獨立重復地進行了n次,那么我們就稱這一系列重復獨立的隨機試驗為n重伯努利試驗、或者伯努利概型。所以單個伯努利試驗是沒有多大意義的,然而,當我們反復進行伯努利試驗,去觀察這些試驗有多少是成功的,多少是失敗的,事情就變得有意義了,這些累計記錄包含了很多潛在的非常有用的信息。

所以我們上面的拋硬幣試驗就屬於伯努利試驗

我們看到,n次獨立的伯努利試驗成功的次數是一個服從二項分布的隨機變量,其中參數為n和p,n為試驗重復的次數,p為發生的概率,然后我們說期望為np。但如果n非常大、p非常小呢,得到np依舊是適中的,但這很明顯是值得我們分析的

現實生活中有沒有這類情況?有,比如我們考慮任何一天內發生飛機事故的總數,記作隨機變量 X,總共飛機飛行的次數 n 非常大,但是單架次飛機出現事故的概率 p 非常小。或者用隨機變量 X 表示一本書中字印刷錯誤的次數,n 表示一本書中的總字數,非常大,而 p 表示每個字印刷出錯的概率,非常小。

這種情況下,n 很大 p 很小,二項分布的分布列可以簡化為我們這里談到的泊松分布的分布列:

其中,λ=np,k=0,1,2,3...

期望和方差滿足:

  • E(X) = λ
  • V(X) = λ

特別的,當我們的 n→∞、且p = λ/n趨近於0時,對應的二項分布列:Px(k) = \(c_{n}^{k}\)pk(1-p)n-k就收斂於上面的泊松分布列了。

通俗點說,就是只要當λ=np,且n非常大、p非常小,泊松分布就是二項分布的一個非常好的近似,計算簡便是它的一大很大的優勢。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM