知经 KNOWECON · 卓越的经济金融统计数学学习平台

期望

# 期望 (Expectation)

期望 (Expectation),也称为 期望值 (Expected Value)、均值 (Mean) 或 一阶矩 (First Moment),是{{{概率论}}}和{{{统计学}}}中的一个基本且至关重要的概念。它描述了一个{{{随机变量}}}取值的“平均”大小。从直观上讲,期望是所有可能结果的加权平均值,其中每个结果的权重是其发生的{{{概率}}}。

如果一个随机试验可以被无限次重复,那么所有试验结果的算术平均值将会{{{收敛}}}于该随机变量的期望。这个思想是{{{大数定律}}}的核心。期望用符号 $E[X]$ 或 $\mathbb{E}[X]$ 表示,其中 $X$ 是一个随机变量。

## 形式化定义

期望的计算方式取决于随机变量是离散的还是连续的。

### 一、离散随机变量 (Discrete Random Variable)

对于一个{{{离散随机变量}}} $X$,它可以取一系列有限或可数无限的值 $\{x_1, x_2, x_3, \dots\}$。其对应的概率由{{{概率质量函数}}} (Probability Mass Function, PMF) $p(x_i) = P(X=x_i)$ 给出。

$X$ 的期望定义为: $$ E[X] = \sum_{i} x_i p(x_i) $$ 这个公式的含义是:将每个可能的取值 $x_i$ 与其发生的概率 $p(x_i)$ 相乘,然后将所有这些乘积相加。

示例:掷一个公平的六面骰子 假设随机变量 $X$ 代表骰子掷出的点数。 * 可能的取值 (样本空间):$\{1, 2, 3, 4, 5, 6\}$。 * 每个取值的概率:由于骰子是公平的,每个点数出现的概率都是 $\frac{1}{6}$。所以 $p(1)=p(2)=\dots=p(6)=\frac{1}{6}$。

根据定义,其期望为: $$ E[X] = 1 \cdot \frac{1}{6} + 2 \cdot \frac{1}{6} + 3 \cdot \frac{1}{6} + 4 \cdot \frac{1}{6} + 5 \cdot \frac{1}{6} + 6 \cdot \frac{1}{6} = \frac{1+2+3+4+5+6}{6} = \frac{21}{6} = 3.5 $$ 解释:期望值 3.5 并不代表某一次投掷可能出现的结果(因为骰子没有3.5这个点数),而是如果我们进行大量投掷后,所有结果的平均值将趋近于 3.5。它代表了该随机变量分布的{{{中心趋势}}}。

### 二、连续随机变量 (Continuous Random Variable)

对于一个{{{连续随机变量}}} $X$,其行为由{{{概率密度函数}}} (Probability Density Function, PDF) $f(x)$ 描述。$f(x)$ 本身不是概率,但其在某个区间上的{{{积分}}}给出了变量落入该区间的概率。

$X$ 的期望定义为: $$ E[X] = \int_{-\infty}^{\infty} x f(x) \,dx $$ 这个积分可以被看作是离散情况下求和的连续模拟。它将每一个可能的取值 $x$ 与其“密度”$f(x)$ 相乘,然后在整个实数轴上进行积分。

示例:{{{均匀分布}}} 假设随机变量 $X$ 服从区间 $[a, b]$ 上的均匀分布。 * 其概率密度函数为:$f(x) = \frac{1}{b-a}$ 对于 $a \le x \le b$,在其他地方 $f(x) = 0$。

根据定义,其期望为: $$ E[X] = \int_{a}^{b} x \cdot \frac{1}{b-a} \,dx = \frac{1}{b-a} \left[ \frac{x^2}{2} \right]_{a}^{b} = \frac{1}{b-a} \left( \frac{b^2 - a^2}{2} \right) = \frac{(b-a)(b+a)}{2(b-a)} = \frac{a+b}{2} $$ 解释:均匀分布的期望是其所在区间的中点,这与我们的直觉完全相符。

## 期望的性质

期望具有一些非常重要的数学性质,这些性质极大地简化了计算和理论推导。

1. 常数的期望:一个常数 $c$ 的期望就是它本身。 $$ E[c] = c $$ 这是因为常数可以被看作是一个以概率 1 取值 $c$ 的随机变量。

2. 线性性质 (Linearity of Expectation):这是期望最重要的性质。对于任意两个随机变量 $X$ 和 $Y$(无论它们是否{{{独立随机变量}}})以及任意常数 $a$ 和 $b$: $$ E[aX + bY] = aE[X] + bE[Y] $$ 这个性质可以推广到任意多个随机变量的线性组合。它意味着“和的期望等于期望的和”,并且可以提出常数因子。这一性质的强大之处在于它对随机变量之间的{{{相关性}}}没有要求。

3. 乘法性质: * 一般情况:通常情况下,$E[XY] \neq E[X]E[Y]$。这两个量之间的差值被定义为 $X$ 和 $Y$ 的{{{协方差}}}:$Cov(X, Y) = E[XY] - E[X]E[Y]$。 * 独立情况:如果 $X$ 和 $Y$ 是 {{{独立随机变量}}},那么它们的乘积的期望等于它们各自期望的乘积。 $$ E[XY] = E[X]E[Y] \quad (\text{当 } X, Y \text{ 独立时}) $$

4. 函数的期望 (LOTUS):如果我们关心一个随机变量 $X$ 的某个函数 $g(X)$ 的期望,我们不需要先求出 $Y=g(X)$ 的分布。我们可以使用所谓的 “无意识统计学家定律” (Law of the Unconscious Statistician) 直接计算: * 离散情况: $E[g(X)] = \sum_i g(x_i) p(x_i)$ * 连续情况: $E[g(X)] = \int_{-\infty}^{\infty} g(x) f(x) \,dx$

例如,这个定律是计算{{{方差}}} $Var(X) = E[(X - E[X])^2]$ 的理论基础。

## 应用与诠释

1. 物理学类比:期望可以被看作是概率分布的 质心 (Center of Mass)。如果将实数轴看作一根杆,在每个点 $x_i$ 处放置质量为 $p(x_i)$ 的物体,那么这根杆的平衡点就是期望 $E[X]$。

2. {{{决策论}}}:在面临不确定性时,期望是做出理性决策的基础。例如,在投资中,一个理性的投资者可能会选择能够带来最高 期望回报 (Expected Return) 的资产。在博弈中,期望收益被用来评估一个赌局是否“有利可图”。如果一个游戏的期望收益为正,则长期参与是划算的。

3. {{{金融学}}}:资产的期望回报是{{{现代投资组合理论}}}和{{{资本资产定价模型 (CAPM)}}}等核心金融模型的基石。它量化了投资者对一项资产未来表现的平均预期。

4. {{{统计推断}}}:期望是定义其他重要统计量(如{{{方差}}}、{{{协方差}}}、{{{偏度}}}和{{{峰度}}})的基础。例如,方差 $Var(X)$ 衡量了数据点围绕其期望波动的程度。

## 延伸概念

### 条件期望 (Conditional Expectation)

{{{条件期望}}} $E[Y|X=x]$ 表示在已知随机变量 $X$ 取值为 $x$ 的条件下,随机变量 $Y$ 的期望。这是一个非常强大的工具,允许我们根据部分信息来更新我们的预测。

一个重要的相关定律是 全期望公式 (Law of Total Expectation),也称作迭代期望定律: $$ E[Y] = E[E[Y|X]] $$ 它表明,一个变量的无条件期望等于其对另一个变量的条件期望的期望值。这在处理复杂模型时非常有用。

### 期望的存在性

并非所有随机变量都有一个明确定义的期望。对于期望存在(即求和或积分收敛)的条件是 绝对收敛: * 离散情况: $\sum_i |x_i| p(x_i) < \infty$ * 连续情况: $\int_{-\infty}^{\infty} |x| f(x) \,dx < \infty$

一个著名的反例是{{{柯西分布}}} (Cauchy Distribution)。由于其“重尾”特性(即远离中心的值仍有不可忽略的概率密度),其计算期望的积分不收敛,因此柯西分布没有定义期望值。这提醒我们,虽然期望是一个普遍的概念,但其应用依赖于底层的数学条件。