根據中心極限定理,我們可以用樣本估計總體的平均值。那么,如果通過n個樣本估計總體的標准差則需要除以n-1,這是為什么呢?
標准差是描述數據與平均值的偏離程度。
而因為樣本的數據量比總體的數據量少,因此很可能會去除掉一些極端值,使得樣本的標准差小於總體標准差。
因此,為了更好的用樣本估計總體的標准差,用樣本計算總體的標准差時,我們通常會用
\begin{equation}\label{equ:square}
S=\sqrt{\frac{\sum(X_i-\overline{X})^2}{n-1}}
\end{equation}
