知经 KNOWECON · 卓越的经济金融统计数学学习平台

条件期望的计算

# 条件期望的计算 (Calculation of Conditional Expectation)

条件期望 (Conditional Expectation) 是{{{概率论}}}和{{{统计学}}}中的一个基石性概念。给定已知的某些信息,条件期望提供了对一个{{{随机变量}}}最优的预测。其记号为 $E[X|\mathcal{F}]$ 或 $E[X|Y]$,表示在已知信息集 $\mathcal{F}$ 或随机变量 $Y$ 的取值后,对随机变量 $X$ 的{{{期望值}}}。

从学习者的角度来看,可以将条件期望理解为 信息的更新对预测的修正。在没有任何信息时,对 $X$ 的最佳猜测是其自身的期望值 $E[X]$。但当获得了新的信息(比如另一个相关变量 $Y$ 的值)后,我们可以利用这个信息来做出一个更精确、更贴近实际的猜测,这个新的猜测就是条件期望。

本文主要聚焦于条件期望的 计算方法,从最基础的情形逐步深入到更抽象的定义。

## 条件期望的计算方法

条件期望的计算方式取决于我们“条件于”的信息类型。主要可以分为三类:条件于一个事件、条件于一个离散随机变量、条件于一个连续随机变量。

### 1. 条件于一个事件 (Conditioning on an Event)

这是最简单的情形,我们在已知某个事件 $A$ 发生(且 $P(A) > 0$)的条件下,求随机变量 $X$ 的期望。

* 对于离散随机变量 $X$: 其计算公式为对所有 $X$ 可能的取值 $x_i$ ,用其{{{条件概率}}} $P(X=x_i | A)$ 作为权重进行加权平均。 $$ E[X|A] = \sum_{i} x_i P(X=x_i | A) $$ 其中,条件概率 $P(X=x_i | A) = \frac{P(\{X=x_i\} \cap A)}{P(A)}$。

* 对于连续随机变量 $X$: 其计算公式则是在事件 $A$ 发生的条件下,对 $X$ 的{{{概率密度函数}}} (PDF) 进行积分。我们首先需要定义条件概率密度函数 $f_{X|A}(x)$。 $$ E[X|A] = \int_{-\infty}^{\infty} x f_{X|A}(x) dx $$ 这里的条件密度 $f_{X|A}(x)$ 在特定情况下有明确形式,例如,若事件 $A=\{X \in B\}$,则 $f_{X|A}(x)$ 是将原密度函数 $f_X(x)$ 限制在集合 $B$ 上并重新标准化的结果。

### 2. 条件于一个离散随机变量 (Conditioning on a Discrete Random Variable)

当我们条件于一个离散随机变量 $Y$ 时,我们实际上是在考察当 $Y$ 取其每一个可能值 $y_j$ 时 $X$ 的期望。

对于任意一个 $Y$ 的可能取值 $y_j$ (满足 $P(Y=y_j) > 0$),条件期望 $E[X|Y=y_j]$ 是一个 数值,其计算方法与条件于事件 $A=\{Y=y_j\}$ 完全相同。

* 若 $X$ 也为离散变量: $$ E[X|Y=y_j] = \sum_i x_i P(X=x_i | Y=y_j) = \sum_i x_i \frac{P(X=x_i, Y=y_j)}{P(Y=y_j)} $$ 这里的 $P(X=x_i, Y=y_j)$ 是 $X$和$Y$的{{{联合概率质量函数}}}。

* 若 $X$ 为连续变量: $$ E[X|Y=y_j] = \int_{-\infty}^{\infty} x f_{X|Y}(x|y_j) dx $$ 其中 $f_{X|Y}(x|y_j)$ 是在 $Y=y_j$ 条件下 $X$ 的条件密度函数。

关键概念:$E[X|Y]$ 本身是一个 新的随机变量。这个随机变量的取值依赖于 $Y$ 的取值。当随机变量 $Y$ 取值为 $y_j$ 时,随机变量 $E[X|Y]$ 的取值就是数值 $E[X|Y=y_j]$。我们可以定义一个函数 $g(y) = E[X|Y=y]$,那么 $E[X|Y]$ 就是这个函数作用于随机变量 $Y$ 的结果,即 $g(Y)$。

### 3. 条件于一个连续随机变量 (Conditioning on a Continuous Random Variable)

这是理论上最复杂但应用最广泛的情形。当 $Y$ 是一个连续随机变量时,任何特定取值 $y$ 的发生概率 $P(Y=y)$ 都为0。因此,我们不能再使用基于事件的初等定义。此时,我们必须借助{{{概率密度函数}}}。

假设 $X$ 和 $Y$ 具有联合概率密度函数 $f_{X,Y}(x,y)$。$Y$ 的{{{边缘概率密度函数}}}为 $f_Y(y) = \int_{-\infty}^{\infty} f_{X,Y}(x,y) dx$。

当 $f_Y(y) > 0$ 时,$X$ 关于 $Y=y$ 的 条件概率密度函数 定义为: $$ f_{X|Y}(x|y) = \frac{f_{X,Y}(x,y)}{f_Y(y)} $$ 有了这个条件密度函数,我们就可以计算条件期望 $E[X|Y=y]$,它是一个关于 $y$ 的函数。 $$ E[X|Y=y] = \int_{-\infty}^{\infty} x f_{X|Y}(x|y) dx $$ 同样地,$E[X|Y]$ 是一个随机变量,是上述函数作用于随机变量 $Y$ 的结果。

示例:假设 $(X,Y)$ 服从{{{二元正态分布}}}。一个重要的特性是,给定 $Y=y$ 时,$X$ 的条件分布仍然是正态分布。因此 $E[X|Y=y]$ 就是这个条件正态分布的均值,它是一个关于 $y$ 的线性函数,这正是{{{线性回归分析}}}的理论基础。

## 条件期望的重要性质

条件期望不仅仅是一个计算工具,它还拥有一系列强大的性质,使其成为现代概率论和金融数学的支柱。设 $X, Y, Z$ 为随机变量。

1. 线性性 (Linearity): 对于任意常数 $a, b$,有 $$ E[aX + bZ | Y] = aE[X|Y] + bE[Z|Y] $$

2. “提取已知信息” (Taking out what is known): 如果一个随机变量 $Z$ 的值可以由 $Y$ 的值完全确定(即 $Z$是 $Y$ 的函数,记为 $Z=h(Y)$),则在以 $Y$ 为条件时,$Z$ 相当于一个“已知”的量,可以被从期望中提出来。 $$ E[h(Y)X | Y] = h(Y)E[X|Y] $$ 一个简单的特例是 $E[h(Y)|Y] = h(Y)$。

3. 全期望定律 (Law of Total Expectation / Law of Iterated Expectations): 这是连接条件期望和普通期望的桥梁,也被称为 塔性质 (Tower Property)。它表明,对条件期望再求期望,会得到原始的期望值。 $$ E[E[X|Y]] = E[X] $$ 直观理解:$E[X]$ 是对 $X$ 所有可能结果的加权平均。$E[X|Y]$ 是在不同信息 $Y$ 下对 $X$ 的一系列“局部”平均。而 $E[E[X|Y]]$ 则是对这些“局部”平均再进行一次总的平均,最终自然会回到全局的平均值 $E[X]$。

4. 独立性 (Independence): 如果 $X$ 和 $Y$ 是相互{{{独立}}}的随机变量,那么知道 $Y$ 的取值对 $X$ 的预测没有任何帮助。因此: $$ E[X|Y] = E[X] $$

## 应用简介

* {{{回归分析}}}:在统计学中,回归函数 $m(x) = E[Y|X=x]$ 本质上就是一个条件期望。它描述了因变量 $Y$ 的期望值如何随着自变量 $X$ 的变化而变化。

* 金融资产定价:在金融学中,一个资产在时刻 $t$ 的价格可以被建模为对其未来收益(比如说 $t+1$ 时刻的 payoff $P_{t+1}$)的{{{贴现}}}条件期望,条件是时刻 $t$ 已知的所有信息 $\mathcal{F}_t$。 $$ \text{Price}_t = E\left[ \frac{P_{t+1}}{1+r} \bigg| \mathcal{F}_t \right] $$ 这个框架是{{{有效市场假说}}}和{{{鞅}}}定价理论的核心。

* 贝叶斯统计:在{{{贝叶斯推断}}}中,参数的后验期望值就是给定数据后,该参数的条件期望。

## 更高阶的视角:基于测度论的定义

在更高等的概率论课程中(例如基于{{{测度论}}}的课程),条件期望 $E[X|\mathcal{G}]$ 被赋予了一个更抽象但更普适的定义。这里 $\mathcal{G}$ 是一个{{{西格玛代数}}},代表了已知的信息。

$Z = E[X|\mathcal{G}]$ 被定义为满足以下两个条件的唯一随机变量: 1. $Z$ 是 $\mathcal{G}$-可测的 (measurable),意味着 $Z$ 的值完全由 $\mathcal{G}$ 中的信息所决定。 2. 对于 $\mathcal{G}$中的任何事件 $A$,都有 $\int_A Z dP = \int_A X dP$。

这个定义统一了前面讨论的所有情况,并且是研究{{{随机过程}}}(如{{{鞅}}}和{{{布朗运动}}})的理论基础。对于初学者,可以将其理解为是对前述计算方法的一个严谨化和推广。