應用統計學
統計量與抽樣分布
精確估計:當總體滿足正態分布時。一個樣本參數估計,估計總體均值時。
總體方差已知時,用樣本均值滿足抽樣分布來估計,(其中,抽樣分布是正態分布,抽樣分布均值是總體均值,抽樣分布方差是總體方差與樣本數的比值)來估計,即如下式:
此方法的進階版就是將樣本均值寫成Z分布形式,z分布滿足正態分布:
總體方差未知時,用樣本均值滿足抽樣分布來估計,(其中,抽樣分布是t分布,抽樣分布與將總體均值的關系)來估計(區間估計),即如下式:
一個樣本參數估計,估計總體方差時(區間估計)。
總體方差未知時,用樣本方差滿足抽樣分布來估計,(其中,抽樣分布是卡方分布,抽樣分布與總體方差的關系)來估計(區間估計),即如下式:
二項分布存在參數比率π,用p(樣本比率)估計
簡單隨機抽樣要求隨機性(即抽到每一個樣本的概率相同,抽到每個球概率不同的情況可能發生在抽取者看到紅球,便抽取紅球),和獨立性(每次抽取的樣本物理條件保持一致)
抽樣分布:抽樣分布是依據抽樣個數n模擬抽出樣本統計量的分布。每一個樣本容量保證相同,若每個樣本40個做100次,則會得到100個樣本均值,所以能夠得到100個抽40個能得到該100個樣本均值的總體均值,這些估計的總體均值是抽樣分布,該抽樣分布的期望對於總體均值來說是無差的。
樣本均值的標准誤差:
樣本均值的標准差:
總體標准差:
樣本標准差:S
粗略估計:當總體未知分布,但是有總體方差時,采用中心極限定理,當抽樣個數達到很大時,樣本均值的抽樣分布近似正態分布:
如果總體是正態分布則樣本均值是精確的服從正態分布