第三章 假設檢驗
區間估計與假設檢驗的基本區別?
上一章中討論了置信區間的估計方法。它是利用樣本數據,以抽樣總體的分布為理論基礎,用一定的概率保證來計算出原總體中未知參數的區間范圍。特別值得注意的是:在作區間估計之前,我們對所要估計的參數是一無所知的。
§ 而在這一章中,我們所要做的工作是,先對要研究的參數作一個假設,然后去檢驗這個假設是否正確。因此假設檢驗對於所研究的參數總是先有一個假設的值。
§ 這也是這兩種方法最基本的區別。
顯著水平(significance level)或概率水平(probability level)是什么?
置信度
如何解釋“顯著性”?
具有顯著性:假設值與真實值之間有隨機誤差,也有真實誤差。
不具有顯著性:假設值與真實值之間只有隨機誤差,沒有真實誤差。
第一類錯誤是何含義?
理解一:真實情況是表面誤差是隨機誤差的概率至少是(1-α)。真實情況是表面誤差是真實誤差和隨機誤差的概率不會超過α。真實情況是表面誤差是真實誤差和隨機誤差,而估計情況是表面誤差是隨機誤差,所以估計錯誤,所以事件“真實情況是表面誤差是真實誤差和隨機誤差,而估計情況是表面誤差是隨機誤差,所以估計錯誤”的概率不會超過α。即第一類錯誤。
理解二:假設檢驗已結束,其結果(顯著或者不顯著)可能出錯的概率不會超過是α,不會出錯的概率至少是(1-α)。
理解三:假陰性,原來是真的,卻被判定是假的。
Ⅱ類錯誤、β錯誤是何含義?
理解一:以為估計出來的分布與原分布是一個分布,實際上是另一個分布的概率。
理解二:假陽性,原來是假的,卻被認為是真的。
即如上圖,你以為應該支持H1,即原分布是population1,但是其實真實情況是population2。因為population1中的點造成了這個錯誤,所以概率是population1中有population2的點。
單邊假設檢驗的假設有何特點?
H0:相等
H1:小於|大於,不是小於或大於,是只有小於,或者只有大於
在樣本平均數與總體平均數差異顯著性檢驗中,實際過程中如何獲知總體平均數?
已知的總體平均數μ一般為一些公認的理論數值、經驗數值或期望數值。
什么是t檢驗法?
t 檢驗法,就是在顯著性檢驗時利用 t分布進行概率計算的檢驗方法。
百分率數服從二項分布,在單值與總體檢驗的過程中需要注意有,在大樣本上有連續性矯正的情況
當滿足n足夠大,p不過小,np>5或者nq<30的條件時,可近似地采用u檢驗法,就是有連續性矯正,即正態近似法來進行顯著性檢驗;
若np和nq均大於30,不必對u進行連續性矯正。
這里的p、q是H0假設中的值
二項分布的假設檢驗的特殊之處在哪里?
二項分布是單因素p,所以只用假設p相同。
什么時候進行連續性矯正?
當滿足n足夠大,p不過小,np>5或者nq<30的條件時,可近似地采用u檢驗法,就是有連續性矯正,即正態近似法來進行顯著性檢驗;
樣本百分率與總體百分率差異顯著性檢驗的連續性矯正是什么?
樣本百分率與總體百分率差異顯著性檢驗的連續性矯正是什么?