概率论 - 方差


  • 方差定义及详细解释:
    • https://baike.baidu.com/item/%E6%96%B9%E5%B7%AE/3108412?fr=aladdin
    • 方差:variance
  • Refer to note of Variance:
  • https://www.cnblogs.com/bigmonkey/p/11097322.html
  • 定义
    • 方差
      • 方差在统计描述和概率分布中各有不同的定义,并有不同的公式。
        在统计描述中,方差用来计算每一个变量(观察值)与总体均数之间的差异。为避免出现离均差总和为零,离均差平方和受样本含量的影响,统计学采用平均离均差平方和来描述变量的变异程度。总体方差计算公式:
        为总体方差,
        为变量,
        为总体均值,
        为总体例数。
      • 实际工作中,总体均数难以得到时,应用样本统计量代替总体参数,经校正后,样本方差计算公式:
        S^2= ∑(X-
        ) ^2 / (n-1)
        S^2为样本方差,X为变量,
        为样本均值,n为样本例数。
        在概率分布中,设X是一个离散型 随机变量,若E{[X-E(X)]^2}存在,则称E{[X-E(X)]^2}为X的方差,记为D(X),Var(X)或DX,其中E(X)是X的期望值,X是变量值,公式中的E是期望值expected value的缩写,意为“变量值与其期望值之差的平方和”的期望值。
      • 离散型随机变量方差计算公式:
        D(X)=E{[X-E(X)]^2}=E(X^2) - [ E(X)]^2
        当D(X)=E{[X-E(X)]^2}称为变量X的方差,而
        称为标准差 均方差 。它与X有相同的量纲。标准差是用来衡量一组数据的离散程度的 统计量
      • 对于连续型随机变量X,若其定义域为(a,b),概率密度函数为f(x),连续型随机变量X方差计算公式:
        D(X)=(x-μ)^2 f(x) dx
        方差刻画了随机变量的取值对于其数学期望的 离散程度。(标准差、方差越大,离散程度越大)
        若X的取值比较集中,则方差D(X)较小,若X的取值比较分散,则方差D(X)较大。
        因此,D(X)是刻画X取值分散程度的一个量,它是衡量取值分散程度的一个尺度。
      • 方差是实际值与 期望值之差 平方平均值,而 标准差是方差算术 平方根。 在实际计算中,我们用以下公式计算方差。
        • 方差是各个数据与 平均数之差的平方的和的平均数,即
          ,其中,x表示 样本的平均数,n表示样本的数量,x i表示个体,而s^2就表示方差。
          而当用
          作为样本X的方差的估计时,发现其数学期望并不是X的方差,而是X方差的
          倍,
          的数学期望才是X的方差,用它作为X的方差的估计具有“ 无偏性”,所以我们总是用
          来估计X的方差,并且把它叫做“ 样本方差”。
        • 方差是和中心偏离的程度,用来衡量一批数据的波动大小(即这批数据偏离平均数的大小)并把它叫做这组数据的方差,记作S 2
        • 样本容量相同的情况下,方差越大,说明数据的波动越大,越不稳定。
          公式可以进一步推导为:
          。其中x为这组数据中的数据,n为大于0的整数。
          方差 方差
    • 标准差
      • 称为标准差均方差), 它与X有相同的量纲。标准差是用来衡量一组数据的离散程度的统计量
  • 方差的公式
    • 设C是常数,则D(C)=0
    • 设X是随机变量,C是常数,则有
    • 设 X 与 Y 是两个随机变量,则
      其中协方差
      特别的,当X,Y是两个不相关的随机变量则
      此性质可以推广到有限多个两两不相关的随机变量之和的情况。
    • D(X)=0的充分必要条件是X以概率1取常数E(X),即
      (当且仅当X取常数值E(X)时的概率为1时,D(X)=0。)
      注:不能得出X恒等于常数,当x是连续的时候X可以在任意有限个点取不等于常数c的值。
    • D(aX+bY)=a2DX+b2DY+2abCov(X,Y)。
  • 方差的种类及公式
  • 随机变量的期望及方差
  • 统计学意义
    • 当数据分布比较分散(即数据在平均数附近波动较大)时,各个数据与平均数的差的平方和较大,方差就较大;
    • 当数据分布比较集中时,各个数据与平均数的差的平方和较小。因此方差越大,数据的波动越大;方差越小,数据的波动就越小。
      • 样本中各数据与 样本平均数的差的平方和的平均数叫做样本方差;
      • 样本方差的 算术平方根叫做样本 标准差
      • 样本方差和样本标准差都是衡量一个样本波动大小的量,样本方差或样本标准差越大,样本数据的波动就越大。
      • 方差和标准差是测算离散趋势最重要、最常用的指标。方差是各变量值与其 均值 离差平方的平均数,它是测算 数值型数据 离散程度的最重要的方法。 标准差为方差的算术平方根,用S表示。方差相应的计算公式为:
        标准差与方差不同的是,标准差和变量的计算单位相同,比方差清楚,因此很多时候我们分析的时候更多的使用的是标准差。
  • 方差演变:某一个变量的方差等于平方的期望减去期望的平方
    • 某一个随机变量的方差就是该随机变量函数的数学期望。我们可以利用数学期望的性质继续向下计算:

        所以说某一个变量的方差等于平方的期望减去期望的平方:


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM