標准差
標准差是數值分散的測量。
標准差的符號是 σ (希臘語字母 西格馬,英語 sigma)
公式很簡單:方差的平方根。那么…… "方差是什么?"
方差
方差的定義是:
離平均的平方距離的平均。
按照以下的步驟來計算方差:
例子
你和朋友們量度了狗狗的身高(毫米):
身高(到肩膀)是:600mm、470mm、170mm、430mm 和 300mm。
求平均、方差和標准差。
第一步是求平均:
答案:
平均 = 600 + 470 + 170 + 430 + 3005 = 19705 = 394
平均身高是 394 mm。我們畫在圖上:
接着求每條狗和平均的距離:
要計算方差,求每個距離的平方,然后求平均:
方差是 21,704
標准差是方差的平方根:
標准差 | |
σ | = √21,704 |
= 147.32…… | |
= 147 (到最近的毫米) |
標准差很有用。 我們現在可以顯示哪個高度是在離平均一個標准差(147mm)之內:
標准差是一個甄別數值是正常與否的"標准"。
羅德維拉犬是高的狗,臘腸犬是矮的狗……但不要告訴它們!
可是……如果數據是樣本數據
以上例子的數據是對象總體的數據(我們的對象就是那 5條狗)。
但如果數據是個樣本(只是對象總體的一部分),計算便會有點改變!
如果你有 "N"個數值,而這些數值是:
- 對象總體:在求方差時除以 N(如上)
- 樣本:在求方差時除以 N-1
其他的計算步驟不變,包括計算平均在內。
例子:如果我們的 5條狗只是更多狗里的的一個樣本,我們便要除以 4,而不是除以 5:
想象這是對樣本數據的 "修補"。
公式
這是在 標准差公式 網頁里的兩個公式(你可以去看看來了解更多):
|
![]() |
"樣本標准差": | ![]() |
乍看很復雜,但其實只是在計算樣本方差時,有個重要的改變:
以除以 N-1 來代替除以 N。
*腳注:為什么要求差的平方?
如果我們只把和平均的差加起來……負值和正值便會互相抵消:
![]() |
4 + 4 − 4 − 44 = 0 |
這不行。我們可以用絕對值嗎?
![]() |
|4| + |4| + |−4| + |−4|4 = 4 + 4 + 4 + 44 = 4 |
不錯(這叫 平均差),但看看這個例子:
![]() |
|7| + |1| + |−6| + |−2|4 = 7 + 1 + 6 + 24 = 4 |
糟了!數據比較分散,但結果還是 4。
我們來試試求每個差的平方(最后才取平方根):
![]() |
√(42 + 42 + 42 + 424) = √(644) = 4 |
![]() |
√(72 + 12 + 62 + 224) = √(904) = 4.74... |
好極了!當數據比較分散時,標准差也比較大……正是我們想要的。
其實這個方法和 兩點之間的距離 都是基於同一個原理,不過應用不同而已。
同時,用代數來處理平方和平方根比處理絕對值要容易很多,標准差也比較容易被應用在其他數學領域。