ARTICLE

variance

方差 (Variance) 方差(Variance)是统计学和概率论中最基本的离散度度量,用于量化一组数据或一个随机变量的取值围绕其期望值(均值)的分散程度。方差越大,数据点偏离均值的程度越大;方差为零意味着所有观测值完全相等。 定义与公式 设 X 为随机变量,其期望值为 = E[X]。X 的总体方差定义为: 第二个等式源于展开:E[(X- )^2] = E

浏览 4 更新 2025-10-26

方差 (Variance)

方差(Variance)是统计学概率论中最基本的离散度度量,用于量化一组数据或一个随机变量的取值围绕其期望值(均值)的分散程度。方差越大,数据点偏离均值的程度越大;方差为零意味着所有观测值完全相等。

定义与公式

XX 为随机变量,其期望值为 μ=E[X]\mu = E[X]XX 的总体方差定义为:

Var(X)=E[(Xμ)2]=E[X2](E[X])2\operatorname{Var}(X) = E\left[(X - \mu)^2\right] = E[X^2] - (E[X])^2

第二个等式源于展开:E[(Xμ)2]=E[X22μX+μ2]=E[X2]2μE[X]+μ2=E[X2]μ2E[(X-\mu)^2] = E[X^2 - 2\mu X + \mu^2] = E[X^2] - 2\mu E[X] + \mu^2 = E[X^2] - \mu^2。这一形式在实际计算中极为常用。

对于有限样本 x1,x2,,xnx_1, x_2, \ldots, x_n样本方差的无偏估计量为:

s2=1n1i=1n(xixˉ)2s^2 = \frac{1}{n-1} \sum_{i=1}^{n} (x_i - \bar{x})^2

其中 xˉ\bar{x}样本均值,分母 n1n-1自由度校正(贝塞尔校正),确保 E[s2]=σ2E[s^2] = \sigma^2。若使用分母 nn(即 Sn2=1n(xixˉ)2S_n^2 = \frac{1}{n}\sum (x_i - \bar{x})^2),则该估计量存在向下偏误。

基本性质

方差具有以下重要运算性质(设 a,ba, b 为常数):

  1. Var(aX+b)=a2Var(X)\operatorname{Var}(aX + b) = a^2 \operatorname{Var}(X)——平移不变,尺度平方放大。
  2. 对于独立随机变量 X,YX, YVar(X±Y)=Var(X)+Var(Y)\operatorname{Var}(X \pm Y) = \operatorname{Var}(X) + \operatorname{Var}(Y)——方差可加。
  3. 一般情形:Var(X±Y)=Var(X)+Var(Y)±2Cov(X,Y)\operatorname{Var}(X \pm Y) = \operatorname{Var}(X) + \operatorname{Var}(Y) \pm 2\operatorname{Cov}(X, Y),其中 Cov(X,Y)\operatorname{Cov}(X, Y)协方差
  4. Var(X)0\operatorname{Var}(X) \ge 0,且 Var(X)=0    P(X=c)=1\operatorname{Var}(X) = 0 \iff P(X = c) = 1(退化分布)。

方差的量纲是原数据量纲的平方,不便直观解释。因此常使用其平方根——标准差 σ=Var(X)\sigma = \sqrt{\operatorname{Var}(X)}——作为派生度量。

方差分析 (ANOVA)

方差分析(Analysis of Variance, ANOVA)由R. A. Fisher提出,是利用方差分解来比较多个组别均值差异的统计方法。其核心思想是将总变异(SST)分解为组间变异(SSB)与组内变异(SSW):

i=1kj=1ni(xijxˉ)2=i=1kni(xˉixˉ)2+i=1kj=1ni(xijxˉi)2\sum_{i=1}^{k} \sum_{j=1}^{n_i} (x_{ij} - \bar{x})^2 = \sum_{i=1}^{k} n_i (\bar{x}_i - \bar{x})^2 + \sum_{i=1}^{k} \sum_{j=1}^{n_i} (x_{ij} - \bar{x}_i)^2

通过F检验比较组间均方与组内均方,判断各总体均值是否存在显著差异。ANOVA广泛用于实验设计、计量经济学中的模型比较和政策评估

经济学与金融学中的应用

金融经济学中,方差是风险的经典度量。马科维茨(Harry Markowitz)的均值-方差分析框架将资产的期望收益与收益方差(或标准差)作为投资者最关心的两个参数,方差在此代表波动率风险。资本资产定价模型(CAPM)中,单个资产的风险被分解为系统性风险(由Beta系数衡量)和可通过多样化分散的非系统性风险。

在计量经济学中,OLS估计量的方差 Var(β^)=σ2(XX)1 \operatorname{Var}(\hat{\beta}) = \sigma^2 (X'X)^{-1} 是统计推断的核心——它决定了置信区间的宽度和假设检验的效力。异方差性(heteroskedasticity)的存在会使标准误估计有偏,需使用White稳健标准误等方法修正。

相关概念

方差隶属于更一般的离散度度量家族,与变异系数(标准差与均值之比,用于消除量纲)、偏度(三阶中心矩)、峰度(四阶中心矩)共同构成描述分布的完整矩体系。在贝叶斯统计中,后验方差衡量参数估计的不确定性程度。方差也与平均绝对离差(MAD)形成对比——后者使用绝对值度量离散度,对异常值更稳健但对数学处理更繁琐。