迭代期望定律 (Law of Iterated Expectations)
迭代期望定律(Law of Iterated Expectations,LIE),也称重叠期望定律 或塔性质 (Tower Property),是概率论 与计量经济学 中的基础定理。该定律陈述:对于可积随机变量Y Y Y 和任意随机变量X X X ,E [ Y ] = E X [ E [ Y ∣ X ] ] \mathbb{E}[Y] = \mathbb{E}_X[\mathbb{E}[Y \mid X]] E [ Y ] = E X [ E [ Y ∣ X ]] ,即Y Y Y 的无条件期望等于给定X X X 时Y Y Y 的条件期望再对X X X 取期望。更一般地,若G ⊆ H \mathcal{G} \subseteq \mathcal{H} G ⊆ H 为子σ \sigma σ -代数,则E [ E [ Y ∣ H ] ∣ G ] = E [ Y ∣ G ] \mathbb{E}[\mathbb{E}[Y \mid \mathcal{H}] \mid \mathcal{G}] = \mathbb{E}[Y \mid \mathcal{G}] E [ E [ Y ∣ H ] ∣ G ] = E [ Y ∣ G ] 。迭代期望定律是连接条件期望与无条件期望的桥梁,在回归分析 、预测理论 、资产定价 和贝叶斯统计 中广泛应用。
形式化定义与直观
设( Ω , F , P ) (\Omega, \mathcal{F}, \mathbb{P}) ( Ω , F , P ) 为概率空间,Y Y Y 可积(E [ ∣ Y ∣ ] < ∞ \mathbb{E}[|Y|] < \infty E [ ∣ Y ∣ ] < ∞ ),X X X 为任意随机变量。迭代期望定律的最常见形式为:
E [ Y ] = E [ E [ Y ∣ X ] ] . \mathbb{E}[Y] = \mathbb{E}\bigl[\mathbb{E}[Y \mid X]\bigr]. E [ Y ] = E [ E [ Y ∣ X ] ] .
其中E [ Y ∣ X ] \mathbb{E}[Y \mid X] E [ Y ∣ X ] 是给定X X X 时Y Y Y 的条件期望,它是X X X 的函数,本身是一个随机变量。外层期望对该随机变量取期望,恢复Y Y Y 的总体均值。
直观上,该定律可通过分段平均来理解:将总体按X X X 的取值划分为若干子群,先计算每个子群内Y Y Y 的均值E [ Y ∣ X = x ] \mathbb{E}[Y \mid X = x] E [ Y ∣ X = x ] ,再以各子群在总体中的比例P ( X = x ) P(X = x) P ( X = x ) 为权重,对所有子群均值加权平均——结果恰好等于总体均值E [ Y ] \mathbb{E}[Y] E [ Y ] 。例如将学生按性别分组,计算男生和女生的平均分并加权,即得全校平均分。无论按何种分组方式,只要分组覆盖全体且不重叠,加权结果必然一致——这正是LIE的实质。
一般塔性质
若G ⊆ H ⊆ F \mathcal{G} \subseteq \mathcal{H} \subseteq \mathcal{F} G ⊆ H ⊆ F ,则对可积随机变量Y Y Y :
E [ E [ Y ∣ H ] ∣ G ] = E [ Y ∣ G ] . \mathbb{E}[\mathbb{E}[Y \mid \mathcal{H}] \mid \mathcal{G}] = \mathbb{E}[Y \mid \mathcal{G}]. E [ E [ Y ∣ H ] ∣ G ] = E [ Y ∣ G ] .
该形式揭示:较小信息集下的条件期望等于先在大信息集下取条件期望再对较小信息集取条件期望。当G = { ∅ , Ω } \mathcal{G} = \{\emptyset, \Omega\} G = { ∅ , Ω } (平凡σ \sigma σ -代数)时,条件期望退化为无条件期望,即得简化形式。塔性质确保了反复条件化不会引入偏误,即"平均的平均就是总平均"。
在计量经济学中的应用
在线性回归模型 中,迭代期望定律是理解零条件均值假设 的基础。对于回归模型Y = β 0 + β 1 X + ϵ Y = \beta_0 + \beta_1 X + \epsilon Y = β 0 + β 1 X + ϵ ,关键假设E [ ϵ ∣ X ] = 0 \mathbb{E}[\epsilon \mid X] = 0 E [ ϵ ∣ X ] = 0 结合LIE可推出:
E [ ϵ ] = E [ E [ ϵ ∣ X ] ] = 0 \mathbb{E}[\epsilon] = \mathbb{E}[\mathbb{E}[\epsilon \mid X]] = 0 E [ ϵ ] = E [ E [ ϵ ∣ X ]] = 0 :误差项无条件均值为零。Cov ( X , ϵ ) = 0 \operatorname{Cov}(X, \epsilon) = 0 Cov ( X , ϵ ) = 0 :由E [ X ϵ ] = E [ X ⋅ E [ ϵ ∣ X ] ] = 0 \mathbb{E}[X\epsilon] = \mathbb{E}[X \cdot \mathbb{E}[\epsilon \mid X]] = 0 E [ X ϵ ] = E [ X ⋅ E [ ϵ ∣ X ]] = 0 得证。
在工具变量 (IV)估计中,LIE为推导两阶段最小二乘法的一致性提供概率基础:第一阶段预测值X ^ \hat{X} X ^ 满足与结构误差的正交条件。在面板数据 的固定效应模型 中,LIE用于处理个体异质性与误差项的相关性结构。
预测理论与方差分解
迭代期望定律是预测理论 的核心。设Y ^ = E [ Y ∣ X ] \hat{Y} = \mathbb{E}[Y \mid X] Y ^ = E [ Y ∣ X ] 为基于信息X X X 的最优预测,则条件期望是均方误差 最小的预测函数,且LIE保证使用更多信息不会使预测的期望偏离真实值。
与条件方差分解 公式紧密相连:
Var ( Y ) = Var ( E [ Y ∣ X ] ) + E [ Var ( Y ∣ X ) ] . \operatorname{Var}(Y) = \operatorname{Var}(\mathbb{E}[Y \mid X]) + \mathbb{E}[\operatorname{Var}(Y \mid X)]. Var ( Y ) = Var ( E [ Y ∣ X ]) + E [ Var ( Y ∣ X )] .
该分解将Y Y Y 的总变异性分为可由X X X 解释的部分(组间方差)和不可解释的部分(组内方差),是方差分析 的理论基础,也是回归中R平方 定义的概率来源。
与相关概念的关系
在贝叶斯统计 中,LIE对应于后验期望的无偏性:后验均值E [ θ ∣ data ] \mathbb{E}[\theta \mid \text{data}] E [ θ ∣ data ] 的先验期望等于先验均值E [ θ ] \mathbb{E}[\theta] E [ θ ] ,即E [ E [ θ ∣ data ] ] = E [ θ ] \mathbb{E}[\mathbb{E}[\theta \mid \text{data}]] = \mathbb{E}[\theta] E [ E [ θ ∣ data ]] = E [ θ ] 。
在资产定价 中,随机贴现因子M M M 满足E [ M R ] = 1 \mathbb{E}[M R] = 1 E [ MR ] = 1 (R R R 为资产收益)。通过LIE将无条件定价关系分解为条件形式E [ M R ∣ F t ] = 1 \mathbb{E}[M R \mid \mathcal{F}_t] = 1 E [ MR ∣ F t ] = 1 ,据此导出条件CAPM 和时变风险溢价的实证框架。Hansen-Jagannathan界限 的推导也依赖LIE。
局限性
迭代期望定律要求E [ ∣ Y ∣ ] < ∞ \mathbb{E}[|Y|] < \infty E [ ∣ Y ∣ ] < ∞ (Y Y Y 可积),否则条件期望无定义。在极值理论 和某些厚尾分布(如柯西分布 )中,该条件可能不满足。此外,当用样本估计E [ Y ∣ X ] \mathbb{E}[Y \mid X] E [ Y ∣ X ] 时,非参数估计的误差会通过LIE传播至无条件推断,需结合渐近理论 审慎处理。
关于知经 KNOWECON
知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌,长期面向北京大学、清华大学、中国人民大学等顶尖院校,提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考,并成功进入理想院校。
知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业,获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者,长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。
我们相信,好的考研辅导不只是押题和陪跑,更是把复杂知识讲清楚、把复习路径设计清楚,并用技术让学习过程更可追踪、更可反馈、更可坚持。