ARTICLE
条件方差
条件方差 (Conditional Variance) 条件方差(Conditional Variance)是概率论和统计学中的一个核心概念,用于衡量一个随机变量在给定另一个(或多个)随机变量的特定取值——即在获得部分信息——后的剩余不确定性。设X和Y为两个随机变量,给定X取特定值x的条件下,Y的条件方差被定义为Y的条件期望的均方差: 其中E[Y|X=x]是
条件方差 (Conditional Variance)
条件方差(Conditional Variance)是概率论和统计学中的一个核心概念,用于衡量一个随机变量在给定另一个(或多个)随机变量的特定取值——即在获得部分信息——后的剩余不确定性。设和为两个随机变量,给定取特定值的条件下,的条件方差被定义为的条件期望的均方差:
其中是在已知条件下的最佳预测值,是预测误差。条件方差有一个更便于计算的形式:。重要的是,本身可看作关于随机变量的函数,因此也是一个随机变量。
核心思想:不确定性的缩减
理解条件方差的关键在于它与信息和不确定性的关系。无条件方差度量了在没有任何其他信息的情况下的总体不确定性或波动性。条件方差度量了在获得关于的信息后剩余的不确定性。通常情况下获得信息会减少不确定性,因此条件方差通常小于无条件方差——知道一个人的教育水平后对其收入水平的预测会更加精确。但这并非绝对,某些情况下条件方差也可能大于无条件方差。
全方差定律
全方差定律(Law of Total Variance),又称方差分解公式,是连接条件方差与无条件方差的桥梁,将总方差分解为两部分:
第一项是条件方差的期望,即在所有可能的取值下的平均剩余不确定性——在回归分析语境中这通常被称为不可解释方差。第二项是条件期望的方差,衡量了由于自变量的变化而导致因变量均值的变化程度——在回归分析中这被称为可解释方差。全方差定律表明:因变量的总不确定性 = 平均剩余不确定性 + 由已知信息引起的不确定性。这个分解在方差分析(ANOVA)和评估模型拟合优度的决定系数等领域具有基础性作用。
应用
在线性回归模型中,同方差性假设误差项的方差对于的所有取值都是常数,即,意味着无论取何值数据点围绕回归线的离散程度相同。异方差性则指条件方差随的变化而变化——如高收入家庭的消费行为波动性远大于低收入家庭。识别和处理异方差性是计量经济学中的重要课题。
在金融学中,资产收益率的波动性表现出波动率聚集现象(高波动时期聚集、低波动时期也聚集),这意味着今天的收益率方差依赖于过去信息。为捕捉这种时变的条件方差,经济学家发展了自回归条件异方差模型(ARCH)和广义自回归条件异方差模型(GARCH)。ARCH(1)模型将时刻的收益率条件方差设为过去收益率平方的函数:。这些模型将条件方差形式化,成为风险管理、期权定价和资产配置等金融应用的核心工具。