如果知道一個隨機變量的分布函數,就能知道這個隨機變量體現出的隨機性的客觀規律。但是很多時候我們不清楚分布函數是什么。有些時候,對於一批數據來說,未必一定要關心分布函數。比如一批產品,我們可能只關心這批產品的平均使用壽命,這里的平均使用壽命是隨機變量的某個數字指標,稱為隨機變量的數字特征。數字特征與“隨機”沒有任何關系,確切地說是通過一系列計算方法將變量的隨機性消除了。
數學期望的概念
數學期望是一種重要的數字特征,它反映隨機變量平均取值的大小,是試驗中每次可能結果的概率乘以其結果的總和。這里的“期望”一詞來源於賭博,大概意思是當你下注時,期望贏得多少錢。
簡單地說,數學期望就是均值,我們以一個例子來說明數學期望。
有一個射擊比賽,分為大、中、小三類目標,其分值和命中率如下:
如果一個選手射擊了三次,假設它一定會命中目標,那么期望的平均分是多少?
這個“期望的平均分”就是一個數學期望,看起來挺簡單:
很遺憾,這是錯誤的結果,它忽略的命中率。正確的均值是:
命中率相當於計算機算法中常說的權重(權重等同於概率論中的概率),通過加權平均才能得到合理的均值。因此說,數學期望就是合理的加權平均值,期望體現在合理二字上,期望值並不一定包含在變量的輸出值集合里。
離散型和連續型隨機變量的數學期望
離散型的數學期望容易理解,離散事件的每個取值都對應一個概率:
可以把xi看作得分,pi相當於得到該分值的概率,它的數學期望是所有變量的加權平均:
對於連續型事件來說,某一點的概率是沒有意義的(詳細說明參見上一章的內容),我們要關注的是某兩個點之間的分布。實際上我們可以借助密度函數表達某一點上的概率。設f(x)是連續型事件的密度函數,那么P(x)=f(x)dx,雖然計算f(x)dx沒有意義,也無法計算,但是並不妨礙用它來表達P(x)。現在知道了某一變量的值和該變量下事件發生的概率(權重),可以計算它的數學期望(加權平均)了:
隨機變量函數的數學期望
有一個隨機變量X,Y=g(X),Y的數學期望是什么?
g(X)是將隨機變量包裹在一個函數內,這似乎有些令人迷惑,我們仍然以射擊的例子說明。
之前的射擊比賽得分太低,組織方打算提高分值,具體做法是在原來的分值基礎上乘以100,即g(x) = 100x:
現在的目標是計算g(X)的數學期望。這次沒那么難以理解了:
雖然得分變了,但命中率未變,也就是每個變量出現的概率沒有變。將問題泛化,如果X是離散型隨機變量,那么隨機變量函數Y=g(X)的數學期望是:
如果X是連續型隨機變量,那么隨機變量函數Y=g(X)的數學期望是:
其中f(x)dx仍然相當於X=x時事件發生的概率P(x)。
數學期望的性質
設C為一個常數,X和Y是兩個隨機變量,則:
性質1是說期望是作用在隨機變量上的,對常數無效;性質3和性質4可以推到到任意有限個相互獨立的隨機變量之和或之積的情況。
作者:我是8位的