方差 (Variance)
方差(Variance)是统计学和概率论中最基本的离散度度量,用于量化一组数据或一个随机变量的取值围绕其期望值(均值)的分散程度。方差越大,数据点偏离均值的程度越大;方差为零意味着所有观测值完全相等。
定义与公式
设 X 为随机变量,其期望值为 μ=E[X]。X 的总体方差定义为:
Var(X)=E[(X−μ)2]=E[X2]−(E[X])2
第二个等式源于展开:E[(X−μ)2]=E[X2−2μX+μ2]=E[X2]−2μE[X]+μ2=E[X2]−μ2。这一形式在实际计算中极为常用。
对于有限样本 x1,x2,…,xn,样本方差的无偏估计量为:
s2=n−11i=1∑n(xi−xˉ)2
其中 xˉ 为样本均值,分母 n−1 为自由度校正(贝塞尔校正),确保 E[s2]=σ2。若使用分母 n(即 Sn2=n1∑(xi−xˉ)2),则该估计量存在向下偏误。
基本性质
方差具有以下重要运算性质(设 a,b 为常数):
- Var(aX+b)=a2Var(X)——平移不变,尺度平方放大。
- 对于独立随机变量 X,Y:Var(X±Y)=Var(X)+Var(Y)——方差可加。
- 一般情形:Var(X±Y)=Var(X)+Var(Y)±2Cov(X,Y),其中 Cov(X,Y) 为协方差。
- Var(X)≥0,且 Var(X)=0⟺P(X=c)=1(退化分布)。
方差的量纲是原数据量纲的平方,不便直观解释。因此常使用其平方根——标准差 σ=Var(X)——作为派生度量。
方差分析 (ANOVA)
方差分析(Analysis of Variance, ANOVA)由R. A. Fisher提出,是利用方差分解来比较多个组别均值差异的统计方法。其核心思想是将总变异(SST)分解为组间变异(SSB)与组内变异(SSW):
i=1∑kj=1∑ni(xij−xˉ)2=i=1∑kni(xˉi−xˉ)2+i=1∑kj=1∑ni(xij−xˉi)2
通过F检验比较组间均方与组内均方,判断各总体均值是否存在显著差异。ANOVA广泛用于实验设计、计量经济学中的模型比较和政策评估。
经济学与金融学中的应用
在金融经济学中,方差是风险的经典度量。马科维茨(Harry Markowitz)的均值-方差分析框架将资产的期望收益与收益方差(或标准差)作为投资者最关心的两个参数,方差在此代表波动率风险。资本资产定价模型(CAPM)中,单个资产的风险被分解为系统性风险(由Beta系数衡量)和可通过多样化分散的非系统性风险。
在计量经济学中,OLS估计量的方差 Var(β^)=σ2(X′X)−1 是统计推断的核心——它决定了置信区间的宽度和假设检验的效力。异方差性(heteroskedasticity)的存在会使标准误估计有偏,需使用White稳健标准误等方法修正。
相关概念
方差隶属于更一般的离散度度量家族,与变异系数(标准差与均值之比,用于消除量纲)、偏度(三阶中心矩)、峰度(四阶中心矩)共同构成描述分布的完整矩体系。在贝叶斯统计中,后验方差衡量参数估计的不确定性程度。方差也与平均绝对离差(MAD)形成对比——后者使用绝对值度量离散度,对异常值更稳健但对数学处理更繁琐。