ARTICLE

数学期望

数学期望 (Mathematical Expectation) 数学期望（Mathematical Expectation），亦称期望值（Expected Value）、均值或一阶矩（First Moment），是概率论和统计学中最基本的概念之一。它表示一个随机变量在重复实验中所有可能取值的概率加权平均——每个可能值以其出现的概率为权重。从直观上理解，数学

浏览 52 更新 2025-10-26

数学期望 (Mathematical Expectation)

数学期望（Mathematical Expectation），亦称期望值（Expected Value）、均值或一阶矩（First Moment），是概率论和统计学中最基本的概念之一。它表示一个随机变量在重复实验中所有可能取值的概率加权平均——每个可能值以其出现的概率为权重。

从直观上理解，数学期望刻画了随机现象在"长期平均"下的结果。若一个赌局的数学期望为正，长期参与将盈利；若为负，则亏损。正是因为这种"长期平均"的解释力，数学期望构成了决策理论、金融学、保险学、博弈论和统计推断等多个领域的分析基础。值得强调的是，期望值本身不必是随机变量的可能取值——例如掷一枚公平骰子的期望点数为 $3.5$ ，但骰子永远掷不出 $3.5$ 点。这一事实揭示了期望作为分布"中心位置"度量的抽象本质。

定义：离散与连续

数学期望的计算形式取决于随机变量的类型。

离散型随机变量。设 $X$ 取值 $x_1, x_2, \ldots$ ，对应概率 $p_i = P(X = x_i)$ 且 $\sum_i p_i = 1$ ，则

E[X] = \sum_i x_i \, P(X = x_i) = \sum_i x_i p_i

这一公式的本质是加权平均——概率越大的值在期望中占据越大的权重。若所有 $x_i$ 等概率（即 $p_i = 1/n$ ），则 $E[X]$ 退化为普通算术平均。

示例：掷公平六面骰子。取值 $\{1, 2, 3, 4, 5, 6\}$ ，各概率均为 $1/6$ ：

E[X] = 1 \cdot \frac{1}{6} + 2 \cdot \frac{1}{6} + \cdots + 6 \cdot \frac{1}{6} = \frac{21}{6} = 3.5

无数次投掷后，点数的算术平均值将收敛于 $3.5$ ，尽管 $3.5$ 不是骰子任何一面的点数。此例虽简单，却精确传达了期望作为概率加权中心的含义。

连续型随机变量。设 $X$ 具有概率密度函数（PDF） $f(x)$ ，满足 $f(x) \ge 0$ 且 $\int_{-\infty}^{\infty} f(x) \, dx = 1$ ，则

E[X] = \int_{-\infty}^{\infty} x \, f(x) \, dx

离散求和 $\sum$ 在此变为积分 $\int$ ，概率质量 $p_i$ 变为概率密度 $f(x)dx$ 。积分范围覆盖 $X$ 的支撑集（support）。

示例：区间 $[a, b]$ 上的均匀分布。密度 $f(x) = \frac{1}{b-a}$ （ $x \in [a,b]$ ），则

E[X] = \int_a^b x \cdot \frac{1}{b-a} \, dx = \frac{a+b}{2}

期望值恰好是区间中点——分布对称性的直接推论。更一般地，对于对称单峰分布（如正态分布），期望值、中位数和众数三者重合于对称中心。

核心性质

设 $X, Y$ 为随机变量， $a, b, c$ 为常数。

常数的期望： $E[c] = c$ 。确定性的量等于其自身。

线性性质（Linearity of Expectation）。这是期望运算最重要的性质：

E[aX + bY] = aE[X] + bE[Y]

关键事实：加法法则 $E[X+Y] = E[X] + E[Y]$ 无条件成立，无论 $X$ 与 $Y$ 是否独立，也无论它们服从何种联合分布。这使得复杂随机变量的期望可分解为若干简单部分期望之和，极大简化了计算。例如，计算 $n$ 次伯努利试验成功次数的期望时，可将总次数写为 $n$ 个指示变量之和，每个指示变量的期望为 $p$ ，故总期望为 $np$ ——无需推导二项分布的概率质量函数。这一技巧在算法分析和组合概率中极为常用。

乘法性质。若 $X$ 与 $Y$ 为独立随机变量，则

E[XY] = E[X] \, E[Y]

独立性是不可或缺的前提。若不独立，该等式一般不成立，偏离程度由协方差度量：

\mathrm{Cov}(X, Y) = E[XY] - E[X]E[Y]

协方差为正意味着 $X$ 与 $Y$ 同向变动，为负意味着反向变动，为零是独立的必要但不充分条件。

函数的期望（LOTUS）。LOTUS（Law of the Unconscious Statistician，无心统计师法则）指出：对任意可测函数 $g$ ， $g(X)$ 的期望可直接用 $X$ 的分布计算，无需先求 $g(X)$ 的分布：

离散情况： $E[g(X)] = \sum_i g(x_i) \, P(X = x_i)$
连续情况： $E[g(X)] = \int_{-\infty}^{\infty} g(x) \, f(x) \, dx$

特例 $g(X) = X^k$ 给出 $k$ 阶矩 $E[X^k]$ 。其中二阶矩 $E[X^2]$ 与期望平方 $(E[X])^2$ 的差即为方差：

\mathrm{Var}(X) = E[X^2] - (E[X])^2

方差衡量分布的离散程度。更高阶矩（偏度、峰度）进一步刻画分布形态。

Jensen 不等式。若 $\phi$ 为凸函数，则 $\phi(E[X]) \le E[\phi(X)]$ 。该不等式在信息论（KL 散度非负性的证明）、金融学（期权定价中的凸性调整）和微观经济学（风险厌恶下的确定性等价）中有广泛应用。

学科应用

金融学。投资的预期收益率是未来可能收益的数学期望。在均值-方差框架下，投资者依据预期收益率与风险（方差或标准差）构建最优投资组合。资本资产定价模型（CAPM）的核心——证券市场线——将资产的预期收益率与其系统风险（ $\beta$ ）线性关联： $E[R_i] = R_f + \beta_i (E[R_m] - R_f)$ 。期权定价中，风险中性测度下的期望贴现 payoff 给出无套利价格。

保险学。保费定价的根本原则是：保费必须覆盖期望赔付。对于寿险，期望赔付 = 死亡概率 $\times$ 保额。保险公司通过汇集大量独立保单，依赖大数定律使实际总赔付以高概率逼近期望总赔付，从而实现精算意义上的收支平衡。超出期望赔付的部分构成风险溢价和运营利润。

决策理论。期望效用理论（Expected Utility Theory）由冯·诺依曼和摩根斯坦公理化建立：面对风险选项，理性决策者最大化期望效用 $E[u(X)]$ 而非期望货币价值 $E[X]$ 。效用函数 $u$ 的凹性刻画了风险厌恶：若 $u$ 严格凹，则 $E[u(X)] < u(E[X])$ ，即决策者偏好确定的期望值而非具有相同期望的风险赌局。这一框架是信息经济学和合同理论中分析激励问题的基础工具。

统计推断。估计量 $\hat{\theta}$ 若满足 $E[\hat{\theta}] = \theta$ ，则称为无偏估计量。样本均值 $\bar{X} = \frac{1}{n}\sum_{i=1}^n X_i$ 是总体均值 $\mu$ 的无偏估计，因为 $E[\bar{X}] = \frac{1}{n} \sum E[X_i] = \mu$ ——这直接由期望的线性性质推出。无偏性是评价估计量优良性的首要标准，与一致性、有效性共同构成经典估计理论的核心准则。

与大数定律的关系

数学期望的"长期平均"直觉由大数定律（Law of Large Numbers）赋予精确数学形式：设 $X_1, X_2, \ldots$ 为独立同分布随机变量序列，且 $E[X_i] = \mu$ ，则样本均值 $\bar{X}_n$ 依概率收敛于 $\mu$ ：

\bar{X}_n = \frac{1}{n}\sum_{i=1}^n X_i \xrightarrow{P} \mu

这一定理是频率学派概率论的逻辑基石：概率被解释为无限次重复实验中相对频率的极限，而期望则是无限次重复实验结果的算术平均极限。大数定律将抽象的数学期望与可观测的现实频率联系了起来，使概率论从纯数学走向经验科学。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。