方差、協方差、標准差、均方差、均方根值、均方誤差、均方根誤差對比分析


 

  • 方差(Variance)

       方差用於衡量隨機變量或一組數據的離散程度,方差在在統計描述和概率分布中有不同的定義和計算公式。①概率論中方差用來度量隨機變量和其數學期望(即均值)之間的偏離程度;②統計中的方差(樣本方差)是每個樣本值與全體樣本均值之差的平方值的平均數,代表每個變量與總體均值間的離散程度。

概率論中計算公式

離散型隨機變量的數學期望: 

                                                                                                             ---------求取期望值

連續型隨機變量的數學期望:

                                                                                                      ----------求取期望值

其中,pi是變量,xi發生的概率,f(x)是概率密度。

                                                      ---------求取方差值

 

統計學中計算公式

 總體方差,也叫做有偏估計,其實就是我們從初高中就學到的那個標准定義的方差:

                                                                                                -----------求取總體均值

其中,n表示這組數據個數,x1、x2、x3……xn表示這組數據具體數值。

                                                    ------------求取總體方差

其中,\bar{X}為數據的平均數,n為數據的個數,s^{2}為方差。

樣本方差,無偏方差,在實際情況中,總體均值\bar{X}是很難得到的,往往通過抽樣來計算,於是有樣本方差,計算公式如下

                                                    --------------求取樣本方差           

此處,為什么要將分母由n變成n-1,主要是為了實現無偏估計減小誤差,請閱讀《為什么樣本方差的分母是 n-1》。    

 

  • 協方差(Covariance)

      協方差在概率論統計學中用於衡量兩個變量的總體誤差。而方差是協方差的一種特殊情況,即當兩個變量是相同的情況。協方差表示的是兩個變量的總體的誤差,這與只表示一個變量誤差的方差不同。 如果兩個變量的變化趨勢一致,也就是說如果其中一個大於自身的期望值,另外一個也大於自身的期望值,那么兩個變量之間的協方差就是正值。 如果兩個變量的變化趨勢相反,即其中一個大於自身的期望值,另外一個卻小於自身的期望值,那么兩個變量之間的協方差就是負值。

formula

formula

其中,E[X]與E[Y]分別為兩個實數隨機變量X與Y的數學期望,Cov(X,Y)為X,Y的協方差。

 

  • 標准差(Standard Deviation)

       標准差也被稱為標准偏差,在中文環境中又常稱均方差,是數據偏離均值的平方和平均后的方根,用σ表示。標准差是方差的算術平方根。標准差能反映一個數據集的離散程度,只是由於方差出現了平方項造成量綱的倍數變化,無法直觀反映出偏離程度,於是出現了標准差,標准偏差越小,這些值偏離平均值就越少,反之亦然。

 

                                                                                              ------------求取樣本標准差

其中,  代表所采用的樣本X1,X2,...,Xn的均值。

 

                                                                                                 -------------求取總體標准差

 其中, 代表總體X的均值。

例:有一組數字分別是200、50、100、200,求它們的樣本標准偏差。

= (200+50+100+200)/4 = 550/4 = 137.5

= [(200-137.5)^2+(50-137.5)^2+(100-137.5)^2+(200-137.5)^2]/(4-1)

樣本標准偏差 S = Sqrt(S^2)=75

 

  • 均方誤差(mean-square error, MSE)

       均方誤差是反映估計量與被估計量之間差異程度的一種度量,換句話說,參數估計值與參數真值之差的平方的期望值。MSE可以評價數據的變化程度,MSE的值越小,說明預測模型描述實驗數據具有更好的精確度。

 

  • 均方根誤差(root mean squared error,RMSE)

      均方根誤差亦稱標准誤差,是均方誤差的算術平方根。換句話說,是觀測值與真值(或模擬值)偏差(而不是觀測值與其平均值之間的偏差)的平方與觀測次數n比值的平方根,在實際測量中,觀測次數n總是有限的,真值只能用最可信賴(最佳)值來代替。標准誤差對一組測量中的特大或特小誤差反映非常敏感,所以,標准誤差能夠很好地反映出測量的精密度。這正是標准誤差在工程測量中廣泛被采用的原因。因此,標准差是用來衡量一組數自身的離散程度,而均方根誤差是用來衡量觀測值同真值之間的偏差。

 

  • 均方根值(root-mean-square,RMES)

       均方根值也稱作為方均根值或有效值,在數據統計分析中,將所有值平方求和,求其均值,再開平方,就得到均方根值。在物理學中,我們常用均方根值來分析噪聲。

        比如幅度為100V而占空比為0.5的方波信號,如果按平均值計算,它的電壓只有50V,而按均方根值計算則有70.71V。這是為什么呢?舉一個例子,有一組100伏的電池組,每次供電10分鍾之后停10分鍾,也就是說占空比為一半。如果這組電池帶動的是10Ω電阻,供電的10分鍾產生10A 的電流和1000W的功率,停電時電流和功率為零。

 

原文:https://blog.csdn.net/cqfdcw/article/details/78173839

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM