1.2 統計量
1.2.1 統計量定義
統計量,由樣本數據算出來的量,把樣本中與所要解決的問題有關的信息集中起來。定義如下:
定義 1.2.1 統計量
由樣本算出來的量稱為統計量。准確地說,統計量是樣本的函數。
此外要做兩點說明:
-
統計量只與樣本有關,不能與未知參數有關。例如,\(X \sim N(a,sigma^2)\),\(X_1,\cdots,X_n\) 是總體 \(X\) 中抽取的簡單隨機樣本(獨立同分布)。則 \(\sum_{i=1}^n X_i\) 是統計量,但當 \(a\) 和 \(\sigma\) 為未知參數時,\(\sum_{i=1}^n (X_i - a)\) 和 \(\sum_{i=1}^n X_i^2 / \sigma^2\) 都不是統計量。
-
樣本具有兩重性:抽樣前視為隨機變量(或向量),抽樣后視為具體的數。統計量是樣本的函數,因此統計量也具有兩重性。
1.2.2 常用統計量
(1) 樣本均值
設 \(X_1,\cdots,X_n\) 是從總體 \(X\) 中抽取的樣本,樣本均值定義為
樣本均值反映了總體均值的信息。
(2) 樣本方差
設 \(X_1,\cdots,X_n\) 是從總體 \(X\) 中抽取的樣本,樣本方差定義為
樣本均值反映了總體方差的信息。同時將 \(S\) 稱為樣本標准差,它反映了總體標准差的信息。有時也用下式作為樣本方差的定義。
樣本均值和樣本方差是兩個最常用的統計量,它們具有如下三個性質:
-
\(\sum_{i=1}^n (X_i - \overline{X}) = 0\)。
-
設非零數 \(a\) 和 \(b\) 為常數,做變換 \(Y_i = a X_i + b,i=1,2,\cdots,n\),則 \(Y_1,\cdots,Y_n\) 的樣本均值 \(\overline{Y} = a \overline{X}\),樣本方差 \(S_{Y}^2 = a^2 S_X^2\)。
-
對於任意常數 \(c\),有
上式等號當且僅當 \(c = \overline{X}\) 時成立。這個性質表明,在偏差平方和最小的准則下,用總體均值 \(a\) 的 \(n\) 次測量值的算術平均值估計 \(a\) 是最好的。
(3) 樣本矩
設 \(X_1,\cdots,X_n\) 為從總體 \(X\) 中抽取的樣本,稱下式為樣本 \(k\) 階原點矩。
特別當 \(k=1\) 時,\(a_{n,1} = \overline{X}\),即樣本均值,稱下式為樣本 \(k\) 階中心矩。
特別當 \(k=2\) 時,\(m_{n,2} = (n-1) S^2 / n\)。
樣本的原點矩和中心距統稱為樣本矩。
(4) 二維隨機向量的樣本矩
設 \((X_1,Y_1),\cdots,(X_n,Y_n)\) 為從二維總體 \(F(x,y)\) 中抽取的樣本。
分別將上式稱為 \(X\) 和 \(Y\) 的樣本均值、樣本方差以及 \(X\) 和 \(Y\) 的樣本協方差。
(5) 次序統計量及其相關統計量
設 \(X_1,\cdots,X_n\) 為從總體 \(X\) 中抽取的樣本,將其按大小排列為 \(X_{(1)} \leqslant X_{(2)} \leqslant \cdots \leqslant X_{(n)}\),則將 \((X_{(1)}, \cdots, X_{(n)})\) 稱為樣本 \((X_1, \cdots, X_n)\) 的次序統計量,其中任意一部分也稱為次序統計量。
利用次序統計量定義下列統計量:
(5.1) 樣本中位數
將下式稱為樣本中位數。