ARTICLE

迭代期望定律

迭代期望定律 (Law of Iterated Expectations) 迭代期望定律(Law of Iterated Expectations,LIE),也称重叠期望定律或塔性质(Tower Property),是概率论与计量经济学中的基础定理。该定律陈述:对于可积随机变量Y和任意随机变量X, E[Y] = E_X[ E[Y X]] ,即Y的无条件期望等

浏览 3 更新 2025-10-26

迭代期望定律 (Law of Iterated Expectations)

迭代期望定律(Law of Iterated Expectations,LIE),也称重叠期望定律塔性质(Tower Property),是概率论计量经济学中的基础定理。该定律陈述:对于可积随机变量YY和任意随机变量XXE[Y]=EX[E[YX]] \mathbb{E}[Y] = \mathbb{E}_X[\mathbb{E}[Y \mid X]] ,即YY的无条件期望等于给定XXYY的条件期望再对XX取期望。更一般地,若GH\mathcal{G} \subseteq \mathcal{H}为子σ\sigma-代数,则E[E[YH]G]=E[YG]\mathbb{E}[\mathbb{E}[Y \mid \mathcal{H}] \mid \mathcal{G}] = \mathbb{E}[Y \mid \mathcal{G}]。迭代期望定律是连接条件期望与无条件期望的桥梁,在回归分析预测理论资产定价贝叶斯统计中广泛应用。

形式化定义与直观

(Ω,F,P)(\Omega, \mathcal{F}, \mathbb{P})为概率空间,YY可积(E[Y]<\mathbb{E}[|Y|] < \infty),XX为任意随机变量。迭代期望定律的最常见形式为:

E[Y]=E[E[YX]].\mathbb{E}[Y] = \mathbb{E}\bigl[\mathbb{E}[Y \mid X]\bigr].

其中E[YX]\mathbb{E}[Y \mid X]是给定XXYY的条件期望,它是XX的函数,本身是一个随机变量。外层期望对该随机变量取期望,恢复YY的总体均值。

直观上,该定律可通过分段平均来理解:将总体按XX的取值划分为若干子群,先计算每个子群内YY的均值E[YX=x]\mathbb{E}[Y \mid X = x],再以各子群在总体中的比例P(X=x)P(X = x)为权重,对所有子群均值加权平均——结果恰好等于总体均值E[Y]\mathbb{E}[Y]。例如将学生按性别分组,计算男生和女生的平均分并加权,即得全校平均分。无论按何种分组方式,只要分组覆盖全体且不重叠,加权结果必然一致——这正是LIE的实质。

一般塔性质

GHF\mathcal{G} \subseteq \mathcal{H} \subseteq \mathcal{F},则对可积随机变量YY

E[E[YH]G]=E[YG].\mathbb{E}[\mathbb{E}[Y \mid \mathcal{H}] \mid \mathcal{G}] = \mathbb{E}[Y \mid \mathcal{G}].

该形式揭示:较小信息集下的条件期望等于先在大信息集下取条件期望再对较小信息集取条件期望。当G={,Ω}\mathcal{G} = \{\emptyset, \Omega\}(平凡σ\sigma-代数)时,条件期望退化为无条件期望,即得简化形式。塔性质确保了反复条件化不会引入偏误,即"平均的平均就是总平均"。

在计量经济学中的应用

线性回归模型中,迭代期望定律是理解零条件均值假设的基础。对于回归模型Y=β0+β1X+ϵY = \beta_0 + \beta_1 X + \epsilon,关键假设E[ϵX]=0\mathbb{E}[\epsilon \mid X] = 0结合LIE可推出:

  1. E[ϵ]=E[E[ϵX]]=0\mathbb{E}[\epsilon] = \mathbb{E}[\mathbb{E}[\epsilon \mid X]] = 0:误差项无条件均值为零。
  2. Cov(X,ϵ)=0\operatorname{Cov}(X, \epsilon) = 0:由E[Xϵ]=E[XE[ϵX]]=0\mathbb{E}[X\epsilon] = \mathbb{E}[X \cdot \mathbb{E}[\epsilon \mid X]] = 0得证。

工具变量(IV)估计中,LIE为推导两阶段最小二乘法的一致性提供概率基础:第一阶段预测值X^\hat{X}满足与结构误差的正交条件。在面板数据固定效应模型中,LIE用于处理个体异质性与误差项的相关性结构。

预测理论与方差分解

迭代期望定律是预测理论的核心。设Y^=E[YX]\hat{Y} = \mathbb{E}[Y \mid X]为基于信息XX的最优预测,则条件期望是均方误差最小的预测函数,且LIE保证使用更多信息不会使预测的期望偏离真实值。

条件方差分解公式紧密相连:

Var(Y)=Var(E[YX])+E[Var(YX)].\operatorname{Var}(Y) = \operatorname{Var}(\mathbb{E}[Y \mid X]) + \mathbb{E}[\operatorname{Var}(Y \mid X)].

该分解将YY的总变异性分为可由XX解释的部分(组间方差)和不可解释的部分(组内方差),是方差分析的理论基础,也是回归中R平方定义的概率来源。

与相关概念的关系

贝叶斯统计中,LIE对应于后验期望的无偏性:后验均值E[θdata]\mathbb{E}[\theta \mid \text{data}]的先验期望等于先验均值E[θ]\mathbb{E}[\theta],即E[E[θdata]]=E[θ]\mathbb{E}[\mathbb{E}[\theta \mid \text{data}]] = \mathbb{E}[\theta]

资产定价中,随机贴现因子MM满足E[MR]=1\mathbb{E}[M R] = 1RR为资产收益)。通过LIE将无条件定价关系分解为条件形式E[MRFt]=1\mathbb{E}[M R \mid \mathcal{F}_t] = 1,据此导出条件CAPM和时变风险溢价的实证框架。Hansen-Jagannathan界限的推导也依赖LIE。

局限性

迭代期望定律要求E[Y]<\mathbb{E}[|Y|] < \inftyYY可积),否则条件期望无定义。在极值理论和某些厚尾分布(如柯西分布)中,该条件可能不满足。此外,当用样本估计E[YX]\mathbb{E}[Y \mid X]时,非参数估计的误差会通过LIE传播至无条件推断,需结合渐近理论审慎处理。