概率論 - 方差


  • 方差定義及詳細解釋:
    • https://baike.baidu.com/item/%E6%96%B9%E5%B7%AE/3108412?fr=aladdin
    • 方差:variance
  • Refer to note of Variance:
  • https://www.cnblogs.com/bigmonkey/p/11097322.html
  • 定義
    • 方差
      • 方差在統計描述和概率分布中各有不同的定義,並有不同的公式。
        在統計描述中,方差用來計算每一個變量(觀察值)與總體均數之間的差異。為避免出現離均差總和為零,離均差平方和受樣本含量的影響,統計學采用平均離均差平方和來描述變量的變異程度。總體方差計算公式:
        為總體方差,
        為變量,
        為總體均值,
        為總體例數。
      • 實際工作中,總體均數難以得到時,應用樣本統計量代替總體參數,經校正后,樣本方差計算公式:
        S^2= ∑(X-
        ) ^2 / (n-1)
        S^2為樣本方差,X為變量,
        為樣本均值,n為樣本例數。
        在概率分布中,設X是一個離散型 隨機變量,若E{[X-E(X)]^2}存在,則稱E{[X-E(X)]^2}為X的方差,記為D(X),Var(X)或DX,其中E(X)是X的期望值,X是變量值,公式中的E是期望值expected value的縮寫,意為“變量值與其期望值之差的平方和”的期望值。
      • 離散型隨機變量方差計算公式:
        D(X)=E{[X-E(X)]^2}=E(X^2) - [ E(X)]^2
        當D(X)=E{[X-E(X)]^2}稱為變量X的方差,而
        稱為標准差 均方差 。它與X有相同的量綱。標准差是用來衡量一組數據的離散程度的 統計量
      • 對於連續型隨機變量X,若其定義域為(a,b),概率密度函數為f(x),連續型隨機變量X方差計算公式:
        D(X)=(x-μ)^2 f(x) dx
        方差刻畫了隨機變量的取值對於其數學期望的 離散程度。(標准差、方差越大,離散程度越大)
        若X的取值比較集中,則方差D(X)較小,若X的取值比較分散,則方差D(X)較大。
        因此,D(X)是刻畫X取值分散程度的一個量,它是衡量取值分散程度的一個尺度。
      • 方差是實際值與 期望值之差 平方平均值,而 標准差是方差算術 平方根。 在實際計算中,我們用以下公式計算方差。
        • 方差是各個數據與 平均數之差的平方的和的平均數,即
          ,其中,x表示 樣本的平均數,n表示樣本的數量,x i表示個體,而s^2就表示方差。
          而當用
          作為樣本X的方差的估計時,發現其數學期望並不是X的方差,而是X方差的
          倍,
          的數學期望才是X的方差,用它作為X的方差的估計具有“ 無偏性”,所以我們總是用
          來估計X的方差,並且把它叫做“ 樣本方差”。
        • 方差是和中心偏離的程度,用來衡量一批數據的波動大小(即這批數據偏離平均數的大小)並把它叫做這組數據的方差,記作S 2
        • 樣本容量相同的情況下,方差越大,說明數據的波動越大,越不穩定。
          公式可以進一步推導為:
          。其中x為這組數據中的數據,n為大於0的整數。
          方差 方差
    • 標准差
      • 稱為標准差均方差), 它與X有相同的量綱。標准差是用來衡量一組數據的離散程度的統計量
  • 方差的公式
    • 設C是常數,則D(C)=0
    • 設X是隨機變量,C是常數,則有
    • 設 X 與 Y 是兩個隨機變量,則
      其中協方差
      特別的,當X,Y是兩個不相關的隨機變量則
      此性質可以推廣到有限多個兩兩不相關的隨機變量之和的情況。
    • D(X)=0的充分必要條件是X以概率1取常數E(X),即
      (當且僅當X取常數值E(X)時的概率為1時,D(X)=0。)
      注:不能得出X恆等於常數,當x是連續的時候X可以在任意有限個點取不等於常數c的值。
    • D(aX+bY)=a2DX+b2DY+2abCov(X,Y)。
  • 方差的種類及公式
  • 隨機變量的期望及方差
  • 統計學意義
    • 當數據分布比較分散(即數據在平均數附近波動較大)時,各個數據與平均數的差的平方和較大,方差就較大;
    • 當數據分布比較集中時,各個數據與平均數的差的平方和較小。因此方差越大,數據的波動越大;方差越小,數據的波動就越小。
      • 樣本中各數據與 樣本平均數的差的平方和的平均數叫做樣本方差;
      • 樣本方差的 算術平方根叫做樣本 標准差
      • 樣本方差和樣本標准差都是衡量一個樣本波動大小的量,樣本方差或樣本標准差越大,樣本數據的波動就越大。
      • 方差和標准差是測算離散趨勢最重要、最常用的指標。方差是各變量值與其 均值 離差平方的平均數,它是測算 數值型數據 離散程度的最重要的方法。 標准差為方差的算術平方根,用S表示。方差相應的計算公式為:
        標准差與方差不同的是,標准差和變量的計算單位相同,比方差清楚,因此很多時候我們分析的時候更多的使用的是標准差。
  • 方差演變:某一個變量的方差等於平方的期望減去期望的平方
    • 某一個隨機變量的方差就是該隨機變量函數的數學期望。我們可以利用數學期望的性質繼續向下計算:

        所以說某一個變量的方差等於平方的期望減去期望的平方:


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM