ARTICLE

条件方差

条件方差 (Conditional Variance) 条件方差(Conditional Variance)是概率论和统计学中的一个核心概念,用于衡量一个随机变量在给定另一个(或多个)随机变量的特定取值——即在获得部分信息——后的剩余不确定性。设X和Y为两个随机变量,给定X取特定值x的条件下,Y的条件方差被定义为Y的条件期望的均方差: 其中E[Y|X=x]是

浏览 7 更新 2025-10-30

条件方差 (Conditional Variance)

条件方差(Conditional Variance)是概率论统计学中的一个核心概念,用于衡量一个随机变量在给定另一个(或多个)随机变量的特定取值——即在获得部分信息——后的剩余不确定性。设XXYY为两个随机变量,给定XX取特定值xx的条件下,YY的条件方差被定义为YY条件期望的均方差:

Var(YX=x)=E[(YE[YX=x])2|X=x]\text{Var}(Y | X=x) = E\left[ \left( Y - E[Y|X=x] \right)^2 \middle| X=x \right]

其中E[YX=x]E[Y|X=x]是在已知X=xX=x条件下YY的最佳预测值,YE[YX=x]Y - E[Y|X=x]是预测误差。条件方差有一个更便于计算的形式:Var(YX=x)=E[Y2X=x](E[YX=x])2\text{Var}(Y|X=x) = E[Y^2 | X=x] - (E[Y|X=x])^2。重要的是,Var(YX)\text{Var}(Y|X)本身可看作关于随机变量XX的函数,因此也是一个随机变量。

核心思想:不确定性的缩减

理解条件方差的关键在于它与信息和不确定性的关系。无条件方差Var(Y)\text{Var}(Y)度量了在没有任何其他信息的情况下YY的总体不确定性或波动性。条件方差Var(YX=x)\text{Var}(Y|X=x)度量了在获得关于XX的信息后YY剩余的不确定性。通常情况下获得信息会减少不确定性,因此条件方差通常小于无条件方差——知道一个人的教育水平后对其收入水平的预测会更加精确。但这并非绝对,某些情况下条件方差也可能大于无条件方差。

全方差定律

全方差定律(Law of Total Variance),又称方差分解公式,是连接条件方差与无条件方差的桥梁,将总方差分解为两部分:

Var(Y)=E[Var(YX)]+Var(E[YX])\text{Var}(Y) = E[\text{Var}(Y|X)] + \text{Var}(E[Y|X])

第一项E[Var(YX)]E[\text{Var}(Y|X)]是条件方差的期望,即在所有可能的XX取值下YY的平均剩余不确定性——在回归分析语境中这通常被称为不可解释方差。第二项Var(E[YX])\text{Var}(E[Y|X])是条件期望的方差,衡量了由于自变量XX的变化而导致因变量YY均值的变化程度——在回归分析中这被称为可解释方差。全方差定律表明:因变量的总不确定性 = 平均剩余不确定性 + 由已知信息引起的不确定性。这个分解在方差分析(ANOVA)和评估模型拟合优度的决定系数R2R^2等领域具有基础性作用。

应用

线性回归模型Y=β0+β1X+ϵY = \beta_0 + \beta_1 X + \epsilon中,同方差性假设误差项的方差对于XX的所有取值都是常数σ2\sigma^2,即Var(YX=x)=σ2\text{Var}(Y|X=x) = \sigma^2,意味着无论XX取何值数据点围绕回归线的离散程度相同。异方差性则指条件方差随XX的变化而变化——如高收入家庭的消费行为波动性远大于低收入家庭。识别和处理异方差性是计量经济学中的重要课题。

金融学中,资产收益率的波动性表现出波动率聚集现象(高波动时期聚集、低波动时期也聚集),这意味着今天的收益率方差依赖于过去信息。为捕捉这种时变的条件方差,经济学家发展了自回归条件异方差模型(ARCH)和广义自回归条件异方差模型(GARCH)。ARCH(1)模型将时刻tt的收益率条件方差σt2\sigma_t^2设为过去收益率平方的函数:σt2=α0+α1rt12\sigma_t^2 = \alpha_0 + \alpha_1 r_{t-1}^2。这些模型将条件方差形式化,成为风险管理期权定价资产配置等金融应用的核心工具。