三大抽樣分布:卡方分布,t分布和F分布的簡單理解


https://blog.csdn.net/anshuai_aw1/article/details/82735201

有很多統計推斷是基於正態分布的假設,以標准正態分布變量為基石而構造的三個著名統計量在實際中有廣泛的應用,這是因為這三個統計量不僅有明確背景,而且其抽樣分布的密度函數有顯式表達式,它們被稱為統計中的“三大抽樣分布”。這三大抽樣分布即為著名的卡方分布,t分布和F分布。

目錄

1 卡方分布(分布)

1.1 定義

1.2 性質

2 t分布

2.1 定義

2.2 性質

3 F分布

3.1 定義

3.2 性質

4 正態總體樣本均值和樣本方差的分布

4.1 正態變量線性函數的分布​

4.2 正態變量樣本均值和樣本方差的分布

5 幾個重要推論

6 總結

 

1 卡方分布(分布)
1.1 定義


設隨機變量 X 是自由度為 n 的 χ2 隨機變量, 則其概率密度函數為

 

表示的是一個gamma函數,它是整數k的封閉形式。gamma函數的介紹如下伽馬函數的總結。

的密度函數 形狀如下圖

 

密度函數的支撐集 (即使密度函數為正的自變量的集合) 為(0, +∞), 從上圖可見當自由度 n 越大, 的密度曲線越趨於對稱, n
越小, 曲線越不對稱. 當 n = 1, 2 時曲線是單調下降趨於 0. 當 n ≥ 3時曲線有單峰, 從 0 開始先單調上升, 在一定位置達到峰值, 然后單下降趨向於 0。

若 X ∼ , 記 ,則 稱為 分布的上側 分位數, 如下圖所示。當 和 給定時可查表求出 之值,如, 等。

 

1.2 性質
χ2 變量具有下列性質:

 

2 t分布
說起t分布,首先要提一句u分布,正態分布(normal distribution)是許多統計方法的理論基礎。正態分布的兩個參數μ和σ決定了正態分布的位置和形態。為了應用方便,常將一般的正態變量X通過u變換[(X-μ)/σ]轉化成標准正態變量u,以使原來各種形態的正態分布都轉換為μ=0,σ=1的標准正態分布(standard normaldistribution),亦稱u分布。根據中心極限定理,通過抽樣模擬試驗表明,在正態分布總體中以固定 n 抽取若干個樣本時,樣本均數的分布仍服從正態分布,即N(μ,σ)。所以,對樣本均數的分布進行u變換,也可變換為標准正態分布N (0,1)。

由於在實際工作中,往往σ(總體方差)是未知的,常用s(樣本方差)作為σ的估計值,為了與u變換區別,稱為t變換,統計量t 值的分布稱為t分布。

2.1 定義


設隨機變量 T ∼ , 則其密度函數為

 

該密度函數的圖形如下

 

的密度函數與標准正態分布 N(0, 1) 密度很相似, 它們都是關於原點對稱, 單峰偶函數, 在 x = 0 處達到極大. 但 的峰值低於
N(0, 1) 的峰值, 的密度函數尾部都要比 N(0, 1) 的兩側尾部粗一些. 容易證明:

 

此處 是 N(0, 1) 變量的密度函數。

 

若T ∼ ,記,則為自由度為n的t分布的雙側分位數(如上圖所示). 當給定 時, ,
等可通過查表求出. 例如  ,等。

t 分布是英國統計學家 W.S. Gosset 在 1908 年以筆名 Student發表的論文中提出的, 故后人稱為 “學生氏 (Student) 分布” 或 “t 分
布”。

2.2 性質
t 變量具有下列的性質:

 

3 F分布
3.1 定義


若隨機變量 Z ∼, 則其密度函數為

 

自由度為 m, n 的 F 分布的密度函數如下圖:

 

 

注意 F 分布的自由度 m 和 n 是有順序的, 當 時, 若將自由度 m 和 n 的順序顛倒一下, 得到的是兩個不同的 F 分布. 從上圖
可見對給定 m = 10, n 取不同值時 的形狀, 我們看到曲線是偏態的, n 越小偏態越嚴重。

 

若 F ∼ , 記 , 則 稱為 F 分布的上側 分位數 (見上圖). 當 m, n 和 給定時, 可以通過查表求出
之值, 例如, 等. 在區間估計和假設檢驗問題中常常用到.

3.2 性質
F 變量具有下列的性質:

 

以上性質中 (1) 和 (2) 是顯然的, (3) 的證明不難. 尤其性質 (3)在求區間估計和假設檢驗問題時會常常用到. 因為當 α 為較小的數,
如 α = 0.05 或 α = 0.01, m, n 給定時, 從已有的 F 分布表上查不到 和 之值, 但它們的值可利用性質(3) 求得, 因為 和 是可以通過查 F 分布表求得的.

4 正態總體樣本均值和樣本方差的分布
為方便討論正態總體樣本均值和樣本方差的分布, 我們先給出正態隨機變量的線性函數的分布.

4.1 正態變量線性函數的分布


4.2 正態變量樣本均值和樣本方差的分布
下述定理給出了正態變量樣本均值和樣本方差的分布和它們的獨立性.

 

5 幾個重要推論
下面幾個推論在正態總體區間估計和假設檢驗問題中有着重要應用.

 

 

 

 

 

6 總結
數據在使用前要注意采用有效的方法收集數據, 如設計好抽樣方案, 安排好試驗等等. 只有有效的收集了數據, 才能有效地使用數據,開展統計推斷工作.獲得數據后, 根據問題的特點和抽樣方式確定抽樣分布, 即統計模型. 基於統計模型, 統計推斷問題可以按照如下的步驟進行:

確定用於統計推斷的合適統計量;
尋求統計量的精確分布; 在統計量的精確分布難以求出的情形,可考慮利用中心極限定理或其它極限定理找出統計量的極限分布.
基於該統計量的精確分布或極限分布, 求出統計推斷問題的精確解或近似解.
根據統計推斷結果對問題作出解釋
其中第二步是最重要, 但也是最困難的一步. 統計三大分布及正態總體下樣本均值和樣本方差的分布, 在尋求與正態變量有關的統計量精確分布時, 起着十分重要作用. 尤其在求區間估計和假設檢驗問題時可以看得十分清楚
————————————————
版權聲明:本文為CSDN博主「anshuai_aw1」的原創文章,遵循CC 4.0 BY-SA版權協議,轉載請附上原文出處鏈接及本聲明。
原文鏈接:https://blog.csdn.net/anshuai_aw1/article/details/82735201


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM