期望值 (Expected Value),也称数学期望或均值,是概率论与统计学中最基本的概念之一。它刻画了一个随机变量所有可能取值的概率加权平均——即按各结果出现可能性的大小进行加权后得到的中心数值,通常记作 E[X] 或 μX。期望值提供了对随机现象的单一数值预测,是描述概率分布集中趋势的核心度量,也是后续理解方差、协方差、矩、回归分析等更高阶统计量与方法的基石。从直觉上看,期望值回答了一个根本问题:在不确定性条件下,平均而言我们应当预期什么结果?
一、形式化定义
根据随机变量的类型,期望值的定义分为离散与连续两种情形。
离散型随机变量:若 X 取可数多个值 x1,x2,…,对应概率 P(X=xi),则期望值为各取值与其概率的乘积之和:
E[X]=i∑xiP(X=xi)
若 X 只有有限个取值 x1,…,xk,求和上限为 k:
E[X]=i=1∑kxiP(X=xi)=x1P(X=x1)+x2P(X=x2)+⋯+xkP(X=xk)
换言之,期望值是取值与概率的内积——概率越大的结果对期望值的贡献越大。
连续型随机变量:若 X 有概率密度函数 f(x),则期望值为 x 与 f(x) 乘积的积分:
E[X]=∫−∞∞xf(x)dx
该积分相当于对连续取值的加权平均,权重由概率密度 f(x) 给出。但并非所有分布都存在期望值——当上述求和或积分不(绝对)收敛时,期望值不存在。柯西分布是典型例子,其概率密度函数的尾部衰减过慢,导致积分发散。
二、核心直观
期望值可从三个互补的角度来把握。
- 长期平均:根据大数定律,随着独立重复试验次数增加,样本均值几乎必然收敛于期望值。例如反复投掷一枚公平六面骰子,点数的长期平均值趋近 3.5。这正是期望值被称为"期望"的原因——它预见了大量重复下的平均结果。
- 加权平均:与简单算术平均不同,期望值以概率为权重。高概率事件贡献大,低概率事件贡献小。若某结果概率为零,它对期望值毫无影响。
- "期望"并非"最可能":投骰子的期望值 3.5 永远不可能实际出现。同样,将新生儿的性别记为 1(男)或 0(女),若男女比例均衡,期望值为 0.5,但没有任何婴儿是半个男性或半个女性。期望值描述的是分布的中心位置,而非具体结果本身。
三、基本性质
期望算子 E[⋅] 具有若干关键数学性质,使其成为概率论中最重要的线性算子之一。设 X,Y 为随机变量,c 为常数。
- 常数的期望:E[c]=c
- 线性性质(最重要的性质):
- 齐次性:E[cX]=cE[X]
- 可加性:E[X+Y]=E[X]+E[Y]
- 推广:E[aX+bY]=aE[X]+bE[Y]
- 线性性质对任意 X,Y 成立,无论它们是否独立。这使得期望值在处理多个随机变量之和时极为强大,例如 E[X1+⋯+Xn]=∑E[Xi] 永远成立,无需任何相关性假设。这一定理在组合优化、随机过程、计量经济学中广泛使用,大大简化了复杂系统的均值计算。
- 独立时的乘法性质:若 X 与 Y独立,则 E[XY]=E[X]E[Y]。当不独立时,二者之差 E[XY]−E[X]E[Y] 定义为协方差 Cov(X,Y),衡量两个变量的线性共变程度。
- 函数的期望:对任意函数 g,E[g(X)] 在离散情形下为 ∑g(xi)P(X=xi),连续情形下为 ∫g(x)f(x)dx。方差即来源于此性质:Var(X)=E[(X−E[X])2]=E[X2]−(E[X])2。
- 单调性:若 X≥Y 几乎必然成立,则 E[X]≥E[Y]。
四、计算示例
示例一:公平骰子 X∈{1,…,6},各面概率 1/6。
E[X]=61+2+⋯+6=621=3.5
示例二:伯努利试验 成功概率 p,X=1(成功)或 0(失败)。
E[X]=1⋅p+0⋅(1−p)=p
该结果直接导出二项分布 B(n,p) 的期望值 np。
示例三:连续均匀分布 X∼U(a,b),f(x)=1/(b−a)。
E[X]=∫abb−axdx=2a+b
即区间中点,与直觉一致。
五、主要应用领域
- 金融与投资:资产或投资组合的预期回报率即未来收益的期望值,是现代投资组合理论的基础。马克维茨的均值-方差框架即以期望收益为核心参数。
- 保险精算:保费基于赔付金额的期望值设定。精算师利用历史数据和概率模型估算索赔期望值,确保保费在覆盖预期赔付、管理成本和利润后仍具竞争力。
- 决策理论:期望效用理论假定理性决策者最大化自身效用的期望值,而非期望货币价值。这解释了为何人们同时购买保险(避免小概率大损失)和购买彩票(追求小概率大收益)——两者在效用期望维度上是合理的。
- 物理学:在量子力学中,可观测量的期望值对应多次测量的平均结果,是理论预测与实验检验之间的桥梁。
六、局限与注意事项
期望值虽应用广泛,但不能单凭其描述一个随机变量。
- 对极端值敏感:极小概率的极端值可显著拉高或拉低期望值。圣彼得堡悖论中,游戏收益的期望值发散至无穷大,然而现实中无人愿意支付大额赌注参与,说明期望值作为唯一决策准则存在根本局限。
- 不反映风险:两个分布可拥有相同期望值但风险截然不同——确定得到 100 元与各有 50\% 概率得 0 或 200 元,期望值均为 100 元,但后者不确定性远高于前者。因此需结合方差、标准差、偏度等更高阶矩来全面描述分布特征。
- 存在性条件:期望值不一定存在。尾部过厚的分布(如柯西分布)的期望积分发散,此时均值不再是有效的统计量。
综上所述,期望值是概率统计体系的基石,是理解随机现象的第一步,也是对后续方差、协方差、回归分析等一切推断方法的逻辑起点。