生物統計學
抽樣分布:n個樣本會得到n個統計量,將這n個統計量作為總體,該總體的分布即是抽樣分布
根據辛欽大數定律,從一個非正態分布的總體中抽取的含量主n的樣本,當n充分大時,樣本平均數漸近服從正態分布。因此平均數的抽樣分布對正態性的要求並不是十分嚴格,但方差的抽樣分布,對總體的正態性的要求是十分嚴格的。
樣本平均值的分布:
基於正態總體(兩個參數都知道)的抽樣分布:
eg':總體n=3,
因為n=2有放回抽樣,有9種可能性:
n=4有放回抽樣,有81種可能性
統計量與總體參數不完全一樣,但是滿足以上關系,所以有:
標准誤就是參數方差
非正態分布總體(兩個參數都知道):根據中心極限定理,大樣本同基於正態總體
所以,只要是大樣本都會滿足z分布,z即滿足N(0,1)
方差未知:用樣本標准差代替總體標准差,並得到t,此時是t滿足自由度為(n-1)的t分布,從PDF可知t分布只與自由度有關,與其他無關。
因為n個數要滿足均數,必有一個數的值受其他數影響,又因為自由度是獨立觀測的個數,所以自由度為n-1:
當自由度較大時,也就是n較大時就是正態分布;t--->u
特征值:
總體分布和抽樣分布的關系:
PS:對於總體分布未知的小樣本並無方法
樣本方差的分布
正態總體時,兩個參數都知道的情況下,樣本方差滿足卡方分布
隨機變量是S方,所以卡方也是一個隨機變量,卡方分布只與自由度有關系。
總結:
兩個正態分布總體(都知道均數和方差),兩個樣本平均數的和與差的分布:利用正態分布加加減減
兩個正態分布總體(都知道均數,但未知方差具體值,但知道方差相等),兩個樣本平均數的和與差的分布:利用他分布加加減減
分布使用條件:1.均值是否已知?2.方差是否已知?3.樣本量是大或者小?