通俗理解中心極限定理


通俗理解中心極限定理

一、總結

一句話總結:

中心極限定理(CLT)指出,如果樣本量足夠大,【則變量均值的采樣分布將近似於正態分布,而與該變量在總體中的分布無關】。

 

1、0-1均勻分布取點例子?

隨着我們從均勻分布中抽取越來越多的隨機樣本,並在直方圖上繪制樣本均值,我們得到一個正態分布結果如下(見右曲線)

 

 

二、通俗理解中心極限定理

轉自或參考:徹底理解中心極限定理——最重要的統計定理之一
https://baijiahao.baidu.com/s?id=1665261046335447411&wfr=spider&for=pc

 

中心極限定理(CLT)是統計學中的一個基本定理,它是一個非常簡單的概念。當你進一步閱讀時就會發現,這也是一個很重要的概念。在閱讀任何其他正態分布之前,必須了解一個先決條件概念,請閱讀我關於正態分布的文章徹底理解正態分布——強大的數學分析工具,它是中心極限定理的完美前傳。

中心極限定理的准定義是:

中心極限定理(CLT)指出,如果樣本量足夠大,則變量均值的采樣分布將近似於正態分布,而與該變量在總體中的分布無關。

解碼晦澀的定義

讓我們直接進入一些例子!

示例# 1

 

 

選取一個均勻分布[0,1],它被稱為均勻分布,因為在0和1之間選擇值的概率相等,因此它的概率密度函數(PDF)是水平的直線。現在,讓我們假設我們從這個分布中隨機抽取20個樣本(綠點)並計算這些樣本的均值,我們得到一個值,在這個例子中是0.5,用虛線表示。讓我們把這個平均值畫在直方圖上。由於這個柱狀圖到目前為止只有一個平均值,它並沒有告訴我們任何其他信息(左圖)。繼續從相同的分布中提取更多的隨機樣本,計算各自的平均值並將這些平均值繪制在直方圖上,我們開始得到一個有趣的結果。

隨着我們從均勻分布中抽取越來越多的隨機樣本,並在直方圖上繪制樣本均值,我們得到一個正態分布結果如下(見右曲線)。

 

 

推論:

我們從均勻的數據分布開始,但是從中抽取的樣本均值是正態分布。

例# 2

在第二個例子中,讓我們按照與第一個例子相同的步驟,唯一的不同是我們這次要從指數分布中提取樣本。

 

 

我們將再次隨機抽取20個樣本,計算樣本的均值,並將其繪制在直方圖上。計算100這樣的樣本的均值並將其畫在直方圖上,這樣的分布對我們來說並不陌生。樣本均值是正態分布!

 

 

推論:我們從指數數據分布開始,但從中抽取樣本的均值得到正態分布。

我們從指數數據分布開始,但是從中抽取的樣本均值得到正態分布。

因此,它在這一點上變得非常直觀,中心極限定理意味着什么?

中心極限定理意味着即使數據分布不是正態的,從中抽取的樣本均值的分布也是正態的。

 

 

知道樣本均值總是正態分布的實際含義是什么?

在分析領域,我們每天都會遇到各種各樣的數據,而源數據的分布並不總是被我們所知道的,但是,因為我們了解中心極限定理,所以我們甚至不需要關心源數據的分布,因為我們總是可以得到正態分布。

為了使中心極限定理能夠起作用,我們必須能夠計算出樣本的平均值。有一個分布稱為柯西分布,沒有樣本均值,從而中心極限定理論並不適用於它,但除了柯西分布,我沒有遇到除中心極限定理以外的任何其他分布。)

下面是了解均值正態分布的實際含義:

我們可以用均值的正態分布來分配置信區間。我們可以進行T檢驗(即兩個樣本均值之間是否存在差異)我們可以進行方差分析(即3個或更多樣本的均值之間是否存在差異)這篇文章涵蓋了我們在處理數據和樣本時應該知道的中心極限定理的整個理論。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM