均值,中值,標准差,方差,正態分布等名詞術語


均值:表示一系列數據或統計總體的平均特征的值。

統計學術語,與“平均”(Average)意義相同。例如: l、3、6,10、20這5個數的均值是8。也同期望。

 

中值[midpoint]

  組距的上下限之算術平均數   [median] 是在一組數據中居於中間的數(特別注意的地方是:這組數據之前已經經過升序排列!!!),即在這組數據中,有一半的數據比它大,有一半的數據比它小。如果這組數據包含偶數個數字,中值是位於中間的兩個數的平均值。

 

標准離差 = 標准差 = 均方差

標准差(Standard Deviation) ,也稱均方差(mean square error),是各數據偏離平均數的距離的平均數,它是離均差平方和平均后的方根,用σ表示。標准差是方差的算術平方根。標准差能反映一個數據集的離散程度。平均數相同的,標准差未必相同

http://baike.baidu.com/view/1024670.htm

標准計算公式   假設有一組數值X1,X2,X3,......Xn(皆為實數),其平均值為μ,公式如圖1.

   圖1

圖1

  標准差也被稱為標准偏差,或者實驗標准差,公式如圖2。

 

圖2

 *(在window7自帶的計算器中有個統計模式)其中這個符號就是計算標准差

 

 

概率密度的數學定義

  對於隨機變量X,若存在一個非負可積函數p(x)(﹣∞ < x < ﹢∞),使得對於任意實數a, b(a < b),都有(公式如右圖)

則稱p(x)為X的概率密度。

 

正態分布

正態分布(normal distribution)又名高斯分布(Gaussian distribution),正態分布是一種概率分布。正態分布是具有兩個參數μ和σ2的連續型隨機變量的分布,第一參數μ是遵從正態分布的隨機變量的均值,第二個參數σ2是此隨機變量的方差, 所以正態分布記作N(μ,σ2 )。遵從正態分布的隨機變量的概率規律為取 μ鄰近的值的概率大 ,而取離μ越遠的值的概率越小;σ越小,分布越集中在μ附近,σ越大,分布越分散。正態分布的密度函數的特點是:關於μ對稱,在μ處達到最大值,在正 (負)無窮遠處取值為0,在μ±σ處有拐點。它的形狀是中間高兩邊低 ,圖像是一條位於x 軸上方的鍾形曲線。 當μ=0,σ2 =1時,稱為標准正態分布,記為N(0,1)。μ維隨機向量具有類似的概率規律時,稱此隨機向量遵從多維正態分布。多元正態分布有很好的性質,例如,多元 正態分布的邊緣分布仍為正態分布,它經任何線性變換得到的隨機向量仍為多維正態分布,特別它的線性組合為一元正態分布。。

正態分布的特征:

1、集中性:正態曲線的高峰位於正中央,即均數所在的位置。

  2、對稱性:正態曲線以均數為中心,左右對稱,曲線兩端永遠不與橫軸相交。

  3、均勻變動性:正態曲線由均數所在處開始,分別向左右兩側逐漸均勻下降。

  4、正態分布有兩個參數,即均數μ和標准差σ,可記作N(μ,σ):均數μ決定正態曲線的中心位置;標准差σ決定正態曲線的陡峭或扁平程度。σ越小,曲線越陡峭;σ越大,曲線越扁平。

  5、u變換:為了便於描述和應用,常將正態變量作數據轉換

http://wiki.mbalib.com/wiki/%E6%AD%A3%E6%80%81%E5%88%86%E5%B8%83

 

方差

方差是各個數據與平均數之差的平方的平均數。在概率論和數理統計中,方差(英文Variance)用來度量隨機變量和其數學期望(即均值)之間的偏離程度。

http://baike.baidu.com/view/172036.htm

  如下面的例子:   已知某零件的真實長度為a,現用甲、乙兩台儀器各測量10次,將測量結果X用坐標上的點表示如圖:   甲儀器測量結果:

乙儀器測量結果:

兩台儀器的測量結果的均值都是 a 。但是用上述結果評價一下兩台儀器的優劣,很明顯,我們會認為乙儀器的性能更好,因為乙儀器的測量結果集中在均值附近。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM