ARTICLE

数学期望

数学期望 (Mathematical Expectation) 数学期望(Mathematical Expectation),亦称期望值(Expected Value)、均值或一阶矩(First Moment),是概率论和统计学中最基本的概念之一。它表示一个随机变量在重复实验中所有可能取值的概率加权平均——每个可能值以其出现的概率为权重。 从直观上理解,数学

浏览 52 更新 2025-10-26

数学期望 (Mathematical Expectation)

数学期望(Mathematical Expectation),亦称期望值(Expected Value)、均值一阶矩(First Moment),是概率论统计学中最基本的概念之一。它表示一个随机变量在重复实验中所有可能取值的概率加权平均——每个可能值以其出现的概率为权重。

从直观上理解,数学期望刻画了随机现象在"长期平均"下的结果。若一个赌局的数学期望为正,长期参与将盈利;若为负,则亏损。正是因为这种"长期平均"的解释力,数学期望构成了决策理论金融学保险学博弈论统计推断等多个领域的分析基础。值得强调的是,期望值本身不必是随机变量的可能取值——例如掷一枚公平骰子的期望点数为 3.5 3.5 ,但骰子永远掷不出 3.5 3.5 点。这一事实揭示了期望作为分布"中心位置"度量的抽象本质。

定义:离散与连续

数学期望的计算形式取决于随机变量的类型。

离散型随机变量。X X 取值 x1,x2, x_1, x_2, \ldots ,对应概率 pi=P(X=xi) p_i = P(X = x_i) ipi=1 \sum_i p_i = 1 ,则

E[X]=ixiP(X=xi)=ixipiE[X] = \sum_i x_i \, P(X = x_i) = \sum_i x_i p_i

这一公式的本质是加权平均——概率越大的值在期望中占据越大的权重。若所有 xi x_i 等概率(即 pi=1/n p_i = 1/n ),则 E[X] E[X] 退化为普通算术平均。

示例:掷公平六面骰子。取值 {1,2,3,4,5,6} \{1, 2, 3, 4, 5, 6\} ,各概率均为 1/6 1/6

E[X]=116+216++616=216=3.5E[X] = 1 \cdot \frac{1}{6} + 2 \cdot \frac{1}{6} + \cdots + 6 \cdot \frac{1}{6} = \frac{21}{6} = 3.5

无数次投掷后,点数的算术平均值将收敛于 3.5 3.5 ,尽管 3.5 3.5 不是骰子任何一面的点数。此例虽简单,却精确传达了期望作为概率加权中心的含义。

连续型随机变量。X X 具有概率密度函数(PDF)f(x) f(x) ,满足 f(x)0 f(x) \ge 0 f(x)dx=1 \int_{-\infty}^{\infty} f(x) \, dx = 1 ,则

E[X]=xf(x)dxE[X] = \int_{-\infty}^{\infty} x \, f(x) \, dx

离散求和 \sum 在此变为积分 \int ,概率质量 pi p_i 变为概率密度 f(x)dx f(x)dx 。积分范围覆盖 X X 的支撑集(support)。

示例:区间 [a,b] [a, b] 上的均匀分布密度 f(x)=1ba f(x) = \frac{1}{b-a} x[a,b] x \in [a,b] ),则

E[X]=abx1badx=a+b2E[X] = \int_a^b x \cdot \frac{1}{b-a} \, dx = \frac{a+b}{2}

期望值恰好是区间中点——分布对称性的直接推论。更一般地,对于对称单峰分布(如正态分布),期望值、中位数和众数三者重合于对称中心。

核心性质

X,Y X, Y 为随机变量,a,b,c a, b, c 为常数。

常数的期望:E[c]=c E[c] = c 。确定性的量等于其自身。

线性性质(Linearity of Expectation)。这是期望运算最重要的性质:

E[aX+bY]=aE[X]+bE[Y]E[aX + bY] = aE[X] + bE[Y]

关键事实:加法法则 E[X+Y]=E[X]+E[Y] E[X+Y] = E[X] + E[Y] 无条件成立,无论 X X Y Y 是否独立,也无论它们服从何种联合分布。这使得复杂随机变量的期望可分解为若干简单部分期望之和,极大简化了计算。例如,计算 n n 次伯努利试验成功次数的期望时,可将总次数写为 n n 个指示变量之和,每个指示变量的期望为 p p ,故总期望为 np np ——无需推导二项分布的概率质量函数。这一技巧在算法分析和组合概率中极为常用。

乘法性质。X X Y Y 独立随机变量,则

E[XY]=E[X]E[Y]E[XY] = E[X] \, E[Y]

独立性是不可或缺的前提。若不独立,该等式一般不成立,偏离程度由协方差度量:

Cov(X,Y)=E[XY]E[X]E[Y]\mathrm{Cov}(X, Y) = E[XY] - E[X]E[Y]

协方差为正意味着 X X Y Y 同向变动,为负意味着反向变动,为零是独立的必要但不充分条件。

函数的期望(LOTUS)。LOTUS(Law of the Unconscious Statistician,无心统计师法则)指出:对任意可测函数 g g g(X) g(X) 的期望可直接用 X X 的分布计算,无需先求 g(X) g(X) 的分布:

  • 离散情况:E[g(X)]=ig(xi)P(X=xi) E[g(X)] = \sum_i g(x_i) \, P(X = x_i)
  • 连续情况:E[g(X)]=g(x)f(x)dx E[g(X)] = \int_{-\infty}^{\infty} g(x) \, f(x) \, dx

特例 g(X)=Xk g(X) = X^k 给出k k 阶矩 E[Xk] E[X^k] 。其中二阶矩 E[X2] E[X^2] 与期望平方 (E[X])2 (E[X])^2 的差即为方差

Var(X)=E[X2](E[X])2\mathrm{Var}(X) = E[X^2] - (E[X])^2

方差衡量分布的离散程度。更高阶矩(偏度、峰度)进一步刻画分布形态。

Jensen 不等式。ϕ \phi 为凸函数,则 ϕ(E[X])E[ϕ(X)] \phi(E[X]) \le E[\phi(X)] 。该不等式在信息论(KL 散度非负性的证明)、金融学(期权定价中的凸性调整)和微观经济学(风险厌恶下的确定性等价)中有广泛应用。

学科应用

金融学。投资的预期收益率是未来可能收益的数学期望。在均值-方差框架下,投资者依据预期收益率与风险方差标准差)构建最优投资组合资本资产定价模型(CAPM)的核心——证券市场线——将资产的预期收益率与其系统风险(β \beta )线性关联:E[Ri]=Rf+βi(E[Rm]Rf) E[R_i] = R_f + \beta_i (E[R_m] - R_f) 。期权定价中,风险中性测度下的期望贴现 payoff 给出无套利价格。

保险学。保费定价的根本原则是:保费必须覆盖期望赔付。对于寿险,期望赔付 = 死亡概率 × \times 保额。保险公司通过汇集大量独立保单,依赖大数定律使实际总赔付以高概率逼近期望总赔付,从而实现精算意义上的收支平衡。超出期望赔付的部分构成风险溢价和运营利润。

决策理论。期望效用理论(Expected Utility Theory)由冯·诺依曼和摩根斯坦公理化建立:面对风险选项,理性决策者最大化期望效用 E[u(X)] E[u(X)] 而非期望货币价值 E[X] E[X] 。效用函数 u u 的凹性刻画了风险厌恶:若 u u 严格凹,则 E[u(X)]<u(E[X]) E[u(X)] < u(E[X]) ,即决策者偏好确定的期望值而非具有相同期望的风险赌局。这一框架是信息经济学和合同理论中分析激励问题的基础工具。

统计推断。估计量 θ^ \hat{\theta} 若满足 E[θ^]=θ E[\hat{\theta}] = \theta ,则称为无偏估计量样本均值 Xˉ=1ni=1nXi \bar{X} = \frac{1}{n}\sum_{i=1}^n X_i 是总体均值 μ \mu 的无偏估计,因为 E[Xˉ]=1nE[Xi]=μ E[\bar{X}] = \frac{1}{n} \sum E[X_i] = \mu ——这直接由期望的线性性质推出。无偏性是评价估计量优良性的首要标准,与一致性、有效性共同构成经典估计理论的核心准则。

与大数定律的关系

数学期望的"长期平均"直觉由大数定律(Law of Large Numbers)赋予精确数学形式:设 X1,X2, X_1, X_2, \ldots 为独立同分布随机变量序列,且 E[Xi]=μ E[X_i] = \mu ,则样本均值 Xˉn \bar{X}_n 依概率收敛于 μ \mu

Xˉn=1ni=1nXiPμ\bar{X}_n = \frac{1}{n}\sum_{i=1}^n X_i \xrightarrow{P} \mu

这一定理是频率学派概率论的逻辑基石:概率被解释为无限次重复实验中相对频率的极限,而期望则是无限次重复实验结果的算术平均极限。大数定律将抽象的数学期望与可观测的现实频率联系了起来,使概率论从纯数学走向经验科学。