目錄:
一、統計量
1、概念
2、常用統計量
二、抽樣分布
1、常見三大抽樣分布
一、統計量:
1、概念:
統計量是統計理論中用來對數據進行分析、檢驗的變量。在實際應用中,當我們從某個總體中抽取一個樣本(X1,X2,X3......,Xn)后,並不能直接用它對總體的有關性質和特征進行推斷,因為樣本雖說是從總體中獲取的代表,含有總體性質的信息,但還是會比較分散。當我們需要將統計的推斷變成可能的,必須要把分散在樣本中的信息集中起來,針對不同的目的,構造不同的樣本函數,這種函數在統計學中成為統計量。
統計量是樣本的一個函數。有樣本構造具體的統計量,實際是對樣本所含的總體信息按照一些要求進行加工處理,把分散在樣本中的信息集中都統計量的取值上。不同的統計推斷問題要求構造不同的統計量。統計量是統計推斷的基礎,相當於概率論中的隨機變量。在統計量的公式中不能依賴於總體分布的未知參數,如包含E(X),D(X)的都不是統計量。
2、常用統計量:
一般在概率論中,將數學期望和方差等概念用‘矩’的概念描述。當n充分大時,有定理可以保證經驗分布函數Fn(x)很靠近總體分布函數F(x)。所以,經驗分布函數Fn(x)的各階矩就反映了總體各階矩的信息。通常把經驗分布函數的各階矩稱為樣本各階矩。常用的樣本各階矩及其函數都是實際應用中的具體統計量。
2.1、樣本均值
,反映出總體X數學期望的信息。
2.2、樣本方差
,反映的是總體X方差的信息
2.3、樣本變異系數
,反映出總體變異系數C的信息。其中變異系數定義為
,反映出隨機變量在以它的均值為單位時取值的離散程度。消除了均值不同對不同總體的離散程度的影響,用來刻畫均值不同時不同總體的離散程度。可應用與投資項目的風險分析、不同群體或行業的收入差距描述中。
2.4、樣本k階矩
,稱
為樣本k階矩。反映了總體k階矩的信息。m1即
即樣本均值。
2.5、樣本k階中心矩
,稱
為樣本k階中心矩。反映出總體k階中心矩的信息。
即樣本方差。
2.6、樣本偏度
,反映了總體偏度的信息。偏度反映了隨機變量密度函數曲線在眾數(密度函數在這一點達到最大值)兩邊的偏斜型。若X~N(μ,σ2),則偏度為0。
2.7、樣本峰度
,反映出總體峰度的信息。峰度反映了密度函數曲線在眾數附近的“峰”的尖峭程度。正態隨機變量X~N(μ,σ2)的峰度為0。偏度和峰度多應用在質量控制和可靠性研究中。
2.8、次序統計量
設 X1,X2, …, Xn是取自總體X的樣本,X(i) 稱為該樣本的第i個次序統計量,它的取值是將樣本觀測值由小到大排列后得到的第i個觀測值。從小到大排序為x(1),x(2), …,x(n),則稱X(1),X(2), …,X(n)為順序統計量。
則




2.9、充分統計量
設 是來自分布函數
的樣本
是一個統計量,如果在給定
的條件下,x的分布與
無關,則稱統計量
為
的充分統計量。
一個統計量 是參數
的充分統計量,其充分必要條件是存在一個t與
的函數
和一個樣本的函數
,使得對於任何一個樣本x和任意的
,樣本的聯合密度函數
可以表示為它們的乘積,即
二、抽樣分布
抽樣分布、參數估計、假設檢驗是統計推斷的重要內容。研究統計量的性質和評價一個統計推斷的優良性,完全取決於抽樣分布的性質。
在總體X的分布類型已知時,若對任一自然數n都能導出統計量T = T(X1,X2,...,Xn)的分布的數學表達式,這種分布稱為精確的抽樣分布,對於樣本量n較小的統計推斷問題很有作用。精確的抽樣分布大多是在正態總體情況下得到的。在正態總體的體檢下,主要有分布,t分布,F分布。
2.1、分布
設隨機變量X1,X2,...,Xn相互獨立,且Xi(i=1,2,...,n)服從標准正態分布N(0,1),則它們的平方和服從自由度為n的
分布。
自由度是統計學常用的概念,可以理解為獨立變量的個數,也可理解為二次型的秩。如:Y=X2是自由度為1的分布,rank(Y)=1;Z=
是自由度為n的
分布,rank(Z)=n。
分布的數學期望為E(
)=n,方差為D(
)=2n。
分布具有可加性,即若
~
(n1),
~
(n2),且獨立,則
+
~
(n1+n2)。
當自由度足夠大時,分布的概率密度曲線趨於對稱。當n--->+∞時,
分布的極限分布是正態分布。
2.2、t分布
設隨機變量X~N(0,1),Y~(n),且X與Y獨立,則
,記t(n).。n為自由度。t分布的密度函數是一偶函數。其密度函數與標准正態分布和很相似,都為單峰偶函數。
2.3、F分布
主要應用於方差分析、回歸方程的顯著性檢驗中。
設隨機變量Y與Z相互獨立,且Y和Z分別服從自由度為m和n 的分布,隨機變量
,則稱X服從第一自由度m,第二自由度為n的F分布,記為F(m,n)。兩個自由度的位置不可互換。
如果隨機變量X服從t(n)分布,則X2服從F(1,n)的F分布。
2.4、樣本均值的分布與中心極限定理
總體分布為正太分布的樣本均值的分布。
當總體分布為正態分布N(μ,σ2)時,的抽樣分布仍為正態分布,期望為μ,方差為σ2/n。
中心極限定理:設從均值μ,方差σ2的任意一個總體中抽取樣本量為n的樣本,當n充分大時,樣本均值的抽樣分布近似服從均值為μ,方差為σ2/n的正態分布。
本文參考中國人民大學出版社《統計學》第七版