用Python學分析 - t分布


1. t分布形狀類似於標准正態分布
2.  t分布是對稱分布,較正態分布離散度強,密度曲線較標准正態分布密度曲線更扁平
3.  對於大型樣本,t-值與z-值之間的差別很小

作用
- t分布糾正了未知的真實標准差的不確定性
- t分布明確解釋了估計總體方差時樣本容量的影響,是適合任何樣本容量都可以使用的合適分布

應用
- 根據小樣本來估計呈正態分布且方差未知的總體的均值
- 對於任何一種樣本容量,真正的平均值抽樣分布是t分布,因此,當存在疑問時,應使用t分布

樣本容量對分布的影響
- 當樣本容量在 30-35之間時,t分布與標准正態分布難以區分
- 當樣本容量達到120時,t分布與標准正態分布實際上完全相同了

自由度df對分布的影響
- 樣本方差使用一個估計的參數(平均值),所以計算置信區間時使用的t分布的自由度為 n - 1
- 由於引入額外的參數(自由度df),t分布比標准正態分布的方差更大(置信區間更寬)
  - 與標准正態分布曲線相比,自由度df越小,t分布曲線愈平坦,曲線中間愈低,曲線雙側尾部翹得愈高
  - 自由度df愈大,t分布曲線愈接近正態分布曲線,當自由度df= ∞ 時,t分布曲線為標准正態分布曲線

圖表顯示t分布

代碼:

 1 # 不同自由度的學生t分布與標准正態分布
 2 import numpy as np
 3 from scipy.stats import norm
 4 from scipy.stats import t
 5 import matplotlib.pyplot as plt
 6 
 7 print('比較t-分布與標准正態分布')
 8 x = np.linspace( -3, 3, 100)
 9 plt.plot(x, t.pdf(x,1), label='df=1')
10 plt.plot(x, t.pdf(x,2), label='df=20')
11 plt.plot(x, t.pdf(x,100), label = 'df=100')
12 plt.plot( x[::5], norm.pdf(x[::5]),'kx', label='normal')
13 plt.legend()
14 plt.show()
View Code

運行結果:

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM