先前概念:
1、樣本點 ζ:
隨機試驗每個可能出現的結果。
骰子有6面,分別記為‘A’、‘B’、‘C’、‘D’、‘E’、‘F’。擲骰子一次,記錄結果,則該隨機試驗的樣本點有6個,其中一個比如為“A面朝上”。
2、樣本空間 Ω:
全體樣本點的集合。
3、事件:
Ω的子集。
“A面或C面朝上”
3、事件域 F:
Ω所有的子集的集合,即事件的集合。
4、概率 P:
姑且可以理解為某個事件發生的可能性。
5、概率空間(Ω,F,P)
6、隨機變量 X:
已知一個概率空間(Ω,F,P),如果對於其樣本空間Ω上的每一個樣本 ζk ,都有一個實數xk = X(ζk) 與它對應。對應於所有樣本ζ∈Ω,則得到定義在Ω上的單值實函數X(ζ)。若每個實數x的數集{X(ζ)<= x}仍是事件域F中的事件,則稱這個單值實函數X(ζ)為隨機變量。
7,二維隨機變量:
X、Y 為定義在同一個概率空間(Ω,F,P)上的兩個隨機變量,則稱其總體(X、Y)為二維隨機變量。
8、數學期望:
對隨機變量的所有可能值作統計平均,這里所有可能值對應於樣本空間內所有樣本點 所映射的實數值。
隨機過程:
舉例,擲骰子,擲3下,分別在t1、t2、t3 三個時刻記錄結果。“A上”對應於實數1;“B上”對應於實數2;“C上”對應於實數3 ,以此類推。。
這就是一個定義在三個時刻上的離散函數,當然可以去定義一個連續的函數。
但是呢,這個函數很奇怪,因為這個函數有多種情況,你可以理解為好多人在和你一起且在同樣的三個時刻擲骰子,所以會有不同的函數出現。而這種情況,其實就對應了隨機變量,我們把所有的函數情況的集合叫作樣本空間,某一種函數叫作樣本點,顯然總共有6*6*6個不同的樣本點。
但是這個和前面定義的有所不同的是,每個樣本點所做的映射不再是一個實數值,而是一個函數,一個隨時間變化的函數,也就是我們在原來隨機變量的基礎上,由一個固定的實數值拓展到一個隨時間變化的實數,即函數。所以此時這就不是一維的隨機變量了,而是二維的一個“隨機過程”。
如果我們去固定樣本,在時間維度去觀察這個隨機過程。
若樣本固定在ζ1 處,好比第一個人去擲骰子,則隨機過程退化為函數1 。X(t1,ζ1)= 1;X(t2,ζ1)= 2;X(t3,ζ1)= 3;
若樣本固定在ζ2 處,好比第二個人去擲骰子,則隨機過程退化為函數2 。X(t1,ζ2)= 2;X(t2,ζ2)= 2;X(t3,ζ2)= 5;
共有6*6*6個不同的樣本點。在人數很大的情況下,最多會出現216種不同的函數。
如果我們去固定時間,在概率空間里去觀察這個隨機過程。
若時間固定在t1 處,則隨機過程退化為隨機變量1 。P(t1, "A上") = 1/6;P(t1, "B上") = 1/6;P(t1, "C上") = 1/6 ... P(t1, "F上") = 1/6。
若時間固定在t2 處,則隨機過程退化為隨機變量2 。P(t2, "A上") = 1/6;P(t2, "B上") = 1/6;P(t2, "C上") = 1/6 ... P(t2, "F上") = 1/6。
若時間固定在t3 處,則隨機過程退化為隨機變量3 。P(t3, "A上") = 1/6;P(t3, "B上") = 1/6;P(t3, "C上") = 1/6 ... P(t3, "F上") = 1/6。
我們發現在固定時間時,退化的隨機變量的樣本和原來隨機過程的樣本是不一樣的,前者是“A上”“B上”之類,映射到實數值,而后者是三次時刻的結果的一個排列,映射到一個隨時間變化的實數值,即函數。
我為什么寫這篇博客呢?
我們往往都知道隨機過程是個二維的,且明白固定時間后會退化成一個隨機變量。但是很多人,包括我之前,在另一維的理解是錯誤的。有人會認為隨機過程的樣本就是“A上”“B上”之類,共有6個樣本點。所以有固定時間相對應的就去固定比如為“A上”在時間域上變化的函數,P(t1,"A上")=1/6;P(t2,"A上")=1/6;P(t3,"A上")=1/6。這是錯誤的!
要去理解好隨機過程的樣本和樣本空間究竟是什么,樣本應該是(如果函數是離散的)就是不同時刻下的排列,不同的排列就是不同的樣本。為什么會這樣呢?
比如還是這個例子,我們要明白我們去做擲骰子的試驗目的是什么,目的是找到一個隨時間變化的函數,而由於函數不是一個固定的,也就是不同人所確定的函數可能是不同的,所以我們去逮了好多人(很多很多,以保證概率)來一起做這個實驗,所以每個人就是一個樣本,它對應的就是那個人所確定的函數。
比如我們去研究一個接收機的噪聲電壓變化,因為噪聲往往是隨機的,所以電壓變化函數也是隨機的,所以每個函數就對應了一個樣本。
由此我們再去理解一道題目,也正是這道題,讓我發現了我原來的理解是有錯誤。
已知一個隨機過程由四條樣本函數組成,而且每條樣本函數出現的概率相同,求自相關函數Rx(t1,t2)。
ζ1 | ζ2 | ζ3 | ζ4 | |
X(t1) | 1 | 2 | 6 | 3 |
X(t2) | 5 | 4 | 2 | 1 |
P | 1/4 | 1/4 | 1/4 | 1/4 |
Rx(t1,t2) = E【X(t1) X(t2)】 。
由前面數學期望的定義,應該是定義在樣本空間上的統計均值,這里注意,是樣本空間,而根據我們前面分析,這里樣本空間只有4個樣本點。所以答案是:
1/4 * (1*5 + 2*4 + 6*2 + 3*1).這是一維的求和。
不是16個值相加!!!不是二維的求和!!!
但是在隨機過程的期望定義就是定義在二維上的啊。。。
其實我們應該這么理解這個積分,這個積分確實是二維的,但是期望是定義在樣本空間上的,所以對應的積分也是定義在樣本空間對應的值域上,這個值域是二維的,但是並不是4*4的,因為總共只有4個樣本,所以值域就是
(1,5) 、(2,4) 、(6,2) 、(3,1) 四個點,而其他點比如(1,4) 、(2,2)並不在這個二維積分的積分空間上,所以答案如前所說。
所以一個隨機過程的兩個不同時間所對應的兩個隨機變量,我們是不能簡單將其理解為一個二維隨機變量,當然拋開隨機過程這個大環境,這兩個確實可以理解為一個二維隨機變量。但是!你一定要明白這里的隨機過程的樣本和退化后的隨機變量的樣本是完全不同的!而在隨機過程中,我們更會去在意前者所帶來的數字特征效果,若是弄混淆了,會對很多地方的理解造成不必要的偏差。