ARTICLE

期望值

期望值 (Expected Value)，也称数学期望或均值，是概率论与统计学中最基本的概念之一。它刻画了一个随机变量所有可能取值的概率加权平均——即按各结果出现可能性的大小进行加权后得到的中心数值，通常记作 E[X] 或 _X 。期望值提供了对随机现象的单一数值预测，是描述概率分布集中趋势的核心度量，也是后续理解方差、协方差、矩、回归分析等更高阶统计量与方

浏览 64 更新 2025-10-26

期望值 (Expected Value)，也称数学期望或均值，是概率论与统计学中最基本的概念之一。它刻画了一个随机变量所有可能取值的概率加权平均——即按各结果出现可能性的大小进行加权后得到的中心数值，通常记作 $E[X]$ 或 $\mu_X$ 。期望值提供了对随机现象的单一数值预测，是描述概率分布集中趋势的核心度量，也是后续理解方差、协方差、矩、回归分析等更高阶统计量与方法的基石。从直觉上看，期望值回答了一个根本问题：在不确定性条件下，平均而言我们应当预期什么结果？

一、形式化定义

根据随机变量的类型，期望值的定义分为离散与连续两种情形。

离散型随机变量：若 $X$ 取可数多个值 $x_1, x_2, \dots$ ，对应概率 $P(X=x_i)$ ，则期望值为各取值与其概率的乘积之和：

E[X] = \sum_{i} x_i \, P(X=x_i)

若 $X$ 只有有限个取值 $x_1,\dots,x_k$ ，求和上限为 $k$ ：

E[X] = \sum_{i=1}^{k} x_i P(X=x_i) = x_1 P(X=x_1) + x_2 P(X=x_2) + \cdots + x_k P(X=x_k)

换言之，期望值是取值与概率的内积——概率越大的结果对期望值的贡献越大。

连续型随机变量：若 $X$ 有概率密度函数 $f(x)$ ，则期望值为 $x$ 与 $f(x)$ 乘积的积分：

E[X] = \int_{-\infty}^{\infty} x \, f(x) \, dx

该积分相当于对连续取值的加权平均，权重由概率密度 $f(x)$ 给出。但并非所有分布都存在期望值——当上述求和或积分不（绝对）收敛时，期望值不存在。柯西分布是典型例子，其概率密度函数的尾部衰减过慢，导致积分发散。

二、核心直观

期望值可从三个互补的角度来把握。

长期平均：根据大数定律，随着独立重复试验次数增加，样本均值几乎必然收敛于期望值。例如反复投掷一枚公平六面骰子，点数的长期平均值趋近 3.5。这正是期望值被称为"期望"的原因——它预见了大量重复下的平均结果。

加权平均：与简单算术平均不同，期望值以概率为权重。高概率事件贡献大，低概率事件贡献小。若某结果概率为零，它对期望值毫无影响。

"期望"并非"最可能"：投骰子的期望值 3.5 永远不可能实际出现。同样，将新生儿的性别记为 1（男）或 0（女），若男女比例均衡，期望值为 0.5，但没有任何婴儿是半个男性或半个女性。期望值描述的是分布的中心位置，而非具体结果本身。

三、基本性质

期望算子 $E[\cdot]$ 具有若干关键数学性质，使其成为概率论中最重要的线性算子之一。设 $X,Y$ 为随机变量， $c$ 为常数。

常数的期望： $E[c] = c$

线性性质（最重要的性质）：

齐次性： $E[cX] = cE[X]$
可加性： $E[X + Y] = E[X] + E[Y]$
推广： $E[aX + bY] = aE[X] + bE[Y]$
线性性质对任意 $X,Y$ 成立，无论它们是否独立。这使得期望值在处理多个随机变量之和时极为强大，例如 $E[X_1 + \cdots + X_n] = \sum E[X_i]$ 永远成立，无需任何相关性假设。这一定理在组合优化、随机过程、计量经济学中广泛使用，大大简化了复杂系统的均值计算。

独立时的乘法性质：若 $X$ 与 $Y$ 独立，则 $E[XY] = E[X]E[Y]$ 。当不独立时，二者之差 $E[XY] - E[X]E[Y]$ 定义为协方差 $\operatorname{Cov}(X,Y)$ ，衡量两个变量的线性共变程度。

函数的期望：对任意函数 $g$ ， $E[g(X)]$ 在离散情形下为 $\sum g(x_i)P(X=x_i)$ ，连续情形下为 $\int g(x)f(x)dx$ 。方差即来源于此性质： $\operatorname{Var}(X) = E[(X - E[X])^2] = E[X^2] - (E[X])^2$ 。

单调性：若 $X \ge Y$ 几乎必然成立，则 $E[X] \ge E[Y]$ 。

四、计算示例

示例一：公平骰子 $X \in \{1,\dots,6\}$ ，各面概率 $1/6$ 。

E[X] = \frac{1+2+\cdots+6}{6} = \frac{21}{6} = 3.5

示例二：伯努利试验 成功概率 $p$ ， $X=1$ （成功）或 $0$ （失败）。

E[X] = 1\cdot p + 0\cdot(1-p) = p

该结果直接导出二项分布 $B(n,p)$ 的期望值 $np$ 。

示例三：连续均匀分布 $X \sim U(a,b)$ ， $f(x)=1/(b-a)$ 。

E[X] = \int_a^b \frac{x}{b-a}\,dx = \frac{a+b}{2}

即区间中点，与直觉一致。

五、主要应用领域

金融与投资：资产或投资组合的预期回报率即未来收益的期望值，是现代投资组合理论的基础。马克维茨的均值-方差框架即以期望收益为核心参数。

保险精算：保费基于赔付金额的期望值设定。精算师利用历史数据和概率模型估算索赔期望值，确保保费在覆盖预期赔付、管理成本和利润后仍具竞争力。

决策理论：期望效用理论假定理性决策者最大化自身效用的期望值，而非期望货币价值。这解释了为何人们同时购买保险（避免小概率大损失）和购买彩票（追求小概率大收益）——两者在效用期望维度上是合理的。

物理学：在量子力学中，可观测量的期望值对应多次测量的平均结果，是理论预测与实验检验之间的桥梁。

六、局限与注意事项

期望值虽应用广泛，但不能单凭其描述一个随机变量。

对极端值敏感：极小概率的极端值可显著拉高或拉低期望值。圣彼得堡悖论中，游戏收益的期望值发散至无穷大，然而现实中无人愿意支付大额赌注参与，说明期望值作为唯一决策准则存在根本局限。

不反映风险：两个分布可拥有相同期望值但风险截然不同——确定得到 100 元与各有 50\% 概率得 0 或 200 元，期望值均为 100 元，但后者不确定性远高于前者。因此需结合方差、标准差、偏度等更高阶矩来全面描述分布特征。

存在性条件：期望值不一定存在。尾部过厚的分布（如柯西分布）的期望积分发散，此时均值不再是有效的统计量。

综上所述，期望值是概率统计体系的基石，是理解随机现象的第一步，也是对后续方差、协方差、回归分析等一切推断方法的逻辑起点。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。