數學 - 數理統計- 第一章 緒論 1.2 統計量


1.2 統計量

1.2.1 統計量定義

統計量,由樣本數據算出來的量,把樣本中與所要解決的問題有關的信息集中起來。定義如下:

定義 1.2.1 統計量

由樣本算出來的量稱為統計量。准確地說,統計量是樣本的函數。

此外要做兩點說明:

  • 統計量只與樣本有關,不能與未知參數有關。例如,\(X \sim N(a,sigma^2)\)\(X_1,\cdots,X_n\) 是總體 \(X\) 中抽取的簡單隨機樣本(獨立同分布)。則 \(\sum_{i=1}^n X_i\) 是統計量,但當 \(a\)\(\sigma\) 為未知參數時,\(\sum_{i=1}^n (X_i - a)\)\(\sum_{i=1}^n X_i^2 / \sigma^2\) 都不是統計量。

  • 樣本具有兩重性:抽樣前視為隨機變量(或向量),抽樣后視為具體的數。統計量是樣本的函數,因此統計量也具有兩重性。

1.2.2 常用統計量

(1) 樣本均值

\(X_1,\cdots,X_n\) 是從總體 \(X\) 中抽取的樣本,樣本均值定義為

\[\overline{X} = \frac{1}{n} \sum_{i=1}^n X_i \]

樣本均值反映了總體均值的信息。

(2) 樣本方差

\(X_1,\cdots,X_n\) 是從總體 \(X\) 中抽取的樣本,樣本方差定義為

\[S^2 = \frac{1}{n - 1} \sum_{i=1}^n (X_i - \overline{X})^2 \]

樣本均值反映了總體方差的信息。同時將 \(S\) 稱為樣本標准差,它反映了總體標准差的信息。有時也用下式作為樣本方差的定義。

\[S_n^2 = \frac{1}{n} \sum_{i=1}^n (X_i - \overline{X})^2 \]

樣本均值樣本方差是兩個最常用的統計量,它們具有如下三個性質:

  • \(\sum_{i=1}^n (X_i - \overline{X}) = 0\)

  • 設非零數 \(a\)\(b\) 為常數,做變換 \(Y_i = a X_i + b,i=1,2,\cdots,n\),則 \(Y_1,\cdots,Y_n\) 的樣本均值 \(\overline{Y} = a \overline{X}\),樣本方差 \(S_{Y}^2 = a^2 S_X^2\)

  • 對於任意常數 \(c\),有

\[\sum_{i=1}^n (X_i - c)^2 \geqslant \sum_{i=1}^n (X_i - \overline{X})^2 \]

上式等號當且僅當 \(c = \overline{X}\) 時成立。這個性質表明,在偏差平方和最小的准則下,用總體均值 \(a\)\(n\) 次測量值的算術平均值估計 \(a\) 是最好的。

(3) 樣本矩

\(X_1,\cdots,X_n\) 為從總體 \(X\) 中抽取的樣本,稱下式為樣本 \(k\) 階原點矩

\[a_{n,k} = \frac{1}{n} \sum_{i=1}^n X_i^k, \quad k=1,2,\cdots \]

特別當 \(k=1\) 時,\(a_{n,1} = \overline{X}\),即樣本均值,稱下式為樣本 \(k\) 階中心矩

\[m_{n,k} = \frac{1}{n} \sum_{i=1}^n (X_i - \overline{X})^k, \quad k=1,2,\cdots \]

特別當 \(k=2\) 時,\(m_{n,2} = (n-1) S^2 / n\)

樣本的原點矩和中心距統稱為樣本矩。

(4) 二維隨機向量的樣本矩

\((X_1,Y_1),\cdots,(X_n,Y_n)\) 為從二維總體 \(F(x,y)\) 中抽取的樣本。

\[\begin{align*} \overline{X} = \frac{1}{n} \sum_{i=1}^n X_i, \quad S_X^2 = \frac{1}{n-1} \sum_{i=1}^n (X_i - \overline{X})^2 \\ \overline{Y} = \frac{1}{n} \sum_{i=1}^n Y_i, \quad S_Y^2 = \frac{1}{n-1} \sum_{i=1}^n (Y_i - \overline{Y})^2 \\ S_{XY} = \frac{1}{n} \sum_{i=1}^n (X_i - \overline{X})(Y_i - \overline{Y}) \end{align*} \]

分別將上式稱為 \(X\)\(Y\) 的樣本均值、樣本方差以及 \(X\)\(Y\) 的樣本協方差。

(5) 次序統計量及其相關統計量

\(X_1,\cdots,X_n\) 為從總體 \(X\) 中抽取的樣本,將其按大小排列為 \(X_{(1)} \leqslant X_{(2)} \leqslant \cdots \leqslant X_{(n)}\),則將 \((X_{(1)}, \cdots, X_{(n)})\) 稱為樣本 \((X_1, \cdots, X_n)\) 的次序統計量,其中任意一部分也稱為次序統計量。

利用次序統計量定義下列統計量:

(5.1) 樣本中位數

將下式稱為樣本中位數。

\[\begin{align*} m_{1/2} = \end{align*} \]


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM