wiki摘錄如下(紅色字體是特別標注的部分):
方差:http://zh.wikipedia.org/wiki/%E6%96%B9%E5%B7%AE
方差
變異量(數)(Variance),應用數學里的專有名詞。在概率論和統計學中,一個隨機變量的方差描述的是它的離散程度,也就是該變量離其期望值的距離。一個實隨機變量的方差也稱為它的二階矩或二階中心動差,恰巧也是它的二階累積量。方差的算術平方根稱為該隨機變量的標准差。
標准差才是變量離其期望值的距離,方差應該是距離的平方
以下的所有定義,都有平均值EX,其實在實際中很多時候會先將變量去中心化,也就是讓變量的均值為0。帶着這個想法看下面的定義,公式會變得更加簡潔一些。
目錄
[隱藏]定義
設X為服從分布F的隨機變量, 如果E[X]是隨機變量X的期望值(平均數μ=E[X])
隨機變量X或者分布F的方差為:
這個定義涵蓋了連續、離散、或兩者都有的隨機變量。方差亦可當作是隨機變量與自己本身的協方差:
方差典型的標記有Var(X),
, 或是
,其表示式可展開成為:
上述的表示式可記為"平方的平均減掉平均的平方"
連續隨機變量
如果隨機變量X是連續分布,並對應至概率密度函數f(x),則其方差為:
此處
是一期望值,
且此處的積分為以X為范圍的x定積分(definite integral)
如果一個連續分布不存在期望值,如柯西分布(Cauchy distribution),也就不會有方差。
離散隨機變量
如果隨機變量X是具有概率質量函數的離散概率分布x1 ↦ p1, ..., xn ↦ pn,則:
此處
是其期望值, i.e.
-
.
當X為有N個相等概率值的平均分布:
N個相等概率值的方差亦可以點對點間的方變量表示為:
特性
方差不會是負的,因為次方計算為正的或為零:
一個常數隨機變量的方差為零,且當一個資料集的方差為零時,其內所有項目皆為相同數值:
方差不變於定位參數的變動。也就是說,如果一個常數被加至一個數列中的所有變量值,此數列的方差不會改變:
如果所有數值被放大一個常數倍,方差會放大此常數的次方倍:
兩個隨機變量合的方差為:
此數Cov(., .)代表協方差。
對於
個隨機變量
的總和:
在樣本空間Ω上存在有限期望和方差的隨機變量構成一個希爾伯特空間: L2(Ω, dP),不過這里的內積和長度跟方差,標准差還是不大一樣。 所以,我們得把這個空間“除”常變量構成的子空間,也就是說把相差一個常數的 所有原來那個空間的隨機變量做成一個等價類。這還是一個新的無窮維線性空間, 並且有一個從舊空間內積誘導出來的新內積,而這個內積就是方差
一般化
如果X是一個向量其取值范圍在實數空間Rn,並且其每個元素都是一個一維隨機變量,我們就把X稱為隨機向量。隨機向量的方差是一維隨機變量方差的自然推廣,其定義為E[(X − μ)(X − μ)T],其中μ = E(X),XT是X的轉置。這個方差是一個非負定的方陣,通常稱為協方差矩陣。
如果X是一個復數隨機變量的向量(向量中每個元素均為復數的隨機變量),那么其方差定義則為E[(X − μ)(X − μ)*],其中X*是X的共軛轉置向量或稱為埃爾米特向量。根據這個定義,變異數為實數。
