ARTICLE

期望值

期望值 (Expected Value),也称数学期望或均值,是概率论与统计学中最基本的概念之一。它刻画了一个随机变量所有可能取值的概率加权平均——即按各结果出现可能性的大小进行加权后得到的中心数值,通常记作 E[X] 或 _X 。期望值提供了对随机现象的单一数值预测,是描述概率分布集中趋势的核心度量,也是后续理解方差、协方差、矩、回归分析等更高阶统计量与方

浏览 64 更新 2025-10-26

期望值 (Expected Value),也称数学期望或均值,是概率论统计学中最基本的概念之一。它刻画了一个随机变量所有可能取值的概率加权平均——即按各结果出现可能性的大小进行加权后得到的中心数值,通常记作 E[X] E[X] μX \mu_X 。期望值提供了对随机现象的单一数值预测,是描述概率分布集中趋势的核心度量,也是后续理解方差协方差回归分析等更高阶统计量与方法的基石。从直觉上看,期望值回答了一个根本问题:在不确定性条件下,平均而言我们应当预期什么结果?

一、形式化定义

根据随机变量的类型,期望值的定义分为离散与连续两种情形。

离散型随机变量:若 X X 取可数多个值 x1,x2, x_1, x_2, \dots ,对应概率 P(X=xi) P(X=x_i) ,则期望值为各取值与其概率的乘积之和:

E[X]=ixiP(X=xi)E[X] = \sum_{i} x_i \, P(X=x_i)

X X 只有有限个取值 x1,,xk x_1,\dots,x_k ,求和上限为 k k

E[X]=i=1kxiP(X=xi)=x1P(X=x1)+x2P(X=x2)++xkP(X=xk)E[X] = \sum_{i=1}^{k} x_i P(X=x_i) = x_1 P(X=x_1) + x_2 P(X=x_2) + \cdots + x_k P(X=x_k)

换言之,期望值是取值与概率的内积——概率越大的结果对期望值的贡献越大。

连续型随机变量:若 X X 概率密度函数 f(x) f(x) ,则期望值为 x x f(x) f(x) 乘积的积分

E[X]=xf(x)dxE[X] = \int_{-\infty}^{\infty} x \, f(x) \, dx

该积分相当于对连续取值的加权平均,权重由概率密度 f(x) f(x) 给出。但并非所有分布都存在期望值——当上述求和或积分不(绝对)收敛时,期望值不存在。柯西分布是典型例子,其概率密度函数的尾部衰减过慢,导致积分发散。

二、核心直观

期望值可从三个互补的角度来把握。

  1. 长期平均:根据大数定律,随着独立重复试验次数增加,样本均值几乎必然收敛于期望值。例如反复投掷一枚公平六面骰子,点数的长期平均值趋近 3.5。这正是期望值被称为"期望"的原因——它预见了大量重复下的平均结果。
  1. 加权平均:与简单算术平均不同,期望值以概率为权重。高概率事件贡献大,低概率事件贡献小。若某结果概率为零,它对期望值毫无影响。
  1. "期望"并非"最可能":投骰子的期望值 3.5 永远不可能实际出现。同样,将新生儿的性别记为 1(男)或 0(女),若男女比例均衡,期望值为 0.5,但没有任何婴儿是半个男性或半个女性。期望值描述的是分布的中心位置,而非具体结果本身。

三、基本性质

期望算子 E[] E[\cdot] 具有若干关键数学性质,使其成为概率论中最重要的线性算子之一。设 X,Y X,Y 为随机变量,c c 为常数。

  1. 常数的期望E[c]=c E[c] = c
  1. 线性性质(最重要的性质):
  • 齐次性:E[cX]=cE[X] E[cX] = cE[X]
  • 可加性:E[X+Y]=E[X]+E[Y] E[X + Y] = E[X] + E[Y]
  • 推广:E[aX+bY]=aE[X]+bE[Y] E[aX + bY] = aE[X] + bE[Y]
  • 线性性质对任意 X,Y X,Y 成立,无论它们是否独立。这使得期望值在处理多个随机变量之和时极为强大,例如 E[X1++Xn]=E[Xi] E[X_1 + \cdots + X_n] = \sum E[X_i] 永远成立,无需任何相关性假设。这一定理在组合优化、随机过程、计量经济学中广泛使用,大大简化了复杂系统的均值计算。
  1. 独立时的乘法性质:若 X X Y Y 独立,则 E[XY]=E[X]E[Y] E[XY] = E[X]E[Y] 。当不独立时,二者之差 E[XY]E[X]E[Y] E[XY] - E[X]E[Y] 定义为协方差 Cov(X,Y) \operatorname{Cov}(X,Y) ,衡量两个变量的线性共变程度。
  1. 函数的期望:对任意函数 g g E[g(X)] E[g(X)] 在离散情形下为 g(xi)P(X=xi) \sum g(x_i)P(X=x_i) ,连续情形下为 g(x)f(x)dx \int g(x)f(x)dx 方差即来源于此性质:Var(X)=E[(XE[X])2]=E[X2](E[X])2 \operatorname{Var}(X) = E[(X - E[X])^2] = E[X^2] - (E[X])^2
  1. 单调性:若 XY X \ge Y 几乎必然成立,则 E[X]E[Y] E[X] \ge E[Y]

四、计算示例

示例一:公平骰子 X{1,,6} X \in \{1,\dots,6\} ,各面概率 1/6 1/6

E[X]=1+2++66=216=3.5E[X] = \frac{1+2+\cdots+6}{6} = \frac{21}{6} = 3.5

示例二:伯努利试验 成功概率 p p X=1 X=1 (成功)或 0 0 (失败)。

E[X]=1p+0(1p)=pE[X] = 1\cdot p + 0\cdot(1-p) = p

该结果直接导出二项分布 B(n,p) B(n,p) 的期望值 np np

示例三:连续均匀分布 XU(a,b) X \sim U(a,b) f(x)=1/(ba) f(x)=1/(b-a)

E[X]=abxbadx=a+b2E[X] = \int_a^b \frac{x}{b-a}\,dx = \frac{a+b}{2}

即区间中点,与直觉一致。

五、主要应用领域

  • 金融与投资资产或投资组合的预期回报率即未来收益的期望值,是现代投资组合理论的基础。马克维茨的均值-方差框架即以期望收益为核心参数。
  • 保险精算:保费基于赔付金额的期望值设定。精算师利用历史数据和概率模型估算索赔期望值,确保保费在覆盖预期赔付、管理成本和利润后仍具竞争力。
  • 决策理论期望效用理论假定理性决策者最大化自身效用的期望值,而非期望货币价值。这解释了为何人们同时购买保险(避免小概率大损失)和购买彩票(追求小概率大收益)——两者在效用期望维度上是合理的。
  • 物理学:在量子力学中,可观测量的期望值对应多次测量的平均结果,是理论预测与实验检验之间的桥梁。

六、局限与注意事项

期望值虽应用广泛,但不能单凭其描述一个随机变量。

  1. 对极端值敏感:极小概率的极端值可显著拉高或拉低期望值。圣彼得堡悖论中,游戏收益的期望值发散至无穷大,然而现实中无人愿意支付大额赌注参与,说明期望值作为唯一决策准则存在根本局限。
  1. 不反映风险:两个分布可拥有相同期望值但风险截然不同——确定得到 100 元与各有 50\% 概率得 0 或 200 元,期望值均为 100 元,但后者不确定性远高于前者。因此需结合方差标准差偏度等更高阶矩来全面描述分布特征。
  1. 存在性条件:期望值不一定存在。尾部过厚的分布(如柯西分布)的期望积分发散,此时均值不再是有效的统计量。

综上所述,期望值是概率统计体系的基石,是理解随机现象的第一步,也是对后续方差、协方差、回归分析等一切推断方法的逻辑起点。