標准差,正態分布,變異系數


標准差

英語:Standard Deviation,數學符號σ,在概率統計中最常使用作為統計分布程度(statistical dispersion)上的測量。標准差定義為方差的算術平方根,反映組內個體間的離散程度。簡單來說,標准差是一組數值自平均值分散開來的程度的一種測量觀念。一個較大的標准差,代表大部分的數值和其平均值之間差異較大;一個較小的標准差,代表這些數值較接近平均值。例如,兩組數的集合{0, 5, 9, 14}和{5, 6, 8, 9}其平均值都是7,但第二個集合具有較小的標准差。公式如下:

,其中u為平均值。

這里示范如何計算一組數的標准差,例如一群孩童年齡的數值為{ 5, 6, 8, 9 }:計算平均值公式如下(結果=7):

計算標准差σ公式如下(σ=1.5811):

正態分布的規則

深藍區域是距平均值小於一個標准差之內的數值范圍,在正態分布中,此范圍所占比率為全部數值之68%;兩個標准差之內(深藍,藍)的比率合起來為95%;三個標准差之內(深藍,藍,淺藍)的比率合起來為99.7%

變異系數

變異系數又稱“標准差率”,是衡量資料中各觀測值變異程度的另一個統計量。當進行兩個或多個資料變異程度的比較時,如果度量單位與平均數相同,可以直接利用標准差來比較。如果單位和(或)平均數不同時,比較其變異程度就不能采用標准差,而需采用標准差與平均數的比值(相對值)來比較。標准差與平均數的比值稱為變異系數,記為C.V。變異系數可以消除單位和(或)平均數不同對兩個或多個資料變異程度比較的影響。變異系數的計算公式為:

變異系數越小,變異(偏離)程度越小,風險也就越小;反之,變異系數越大,變異(偏離)程度越大,風險也就越大。注意,變異系數的大小,同時受平均數和標准差兩個統計量的影響,因而在利用變異系數表示資料的變異程度時,最好將平均數和標准差也列出。

 

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM