# 数学期望 (Mathematical Expectation)
数学期望 (Mathematical Expectation),也常被称为 期望值 (Expected Value)、均值 (Mean) 或 一阶矩 (First Moment),是{{{概率论}}}和{{{统计学}}}中的一个基本且极其重要的概念。它描述的是一个{{{随机变量}}}在多次重复实验中,所有可能取值的加权平均值,其中每个值的权重是其出现的{{{概率}}}。
从直观上看,数学期望代表了随机现象在“长期平均”下的结果。例如,如果一个赌局的数学期望为正,那么长期参与这个赌局,平均每次会盈利;反之,如果为负,则平均每次会亏损。数学期望是{{{决策理论}}}、{{{金融学}}}、{{{保险学}}}以及许多其他领域的理论基石。
## 定义
数学期望的计算方式取决于随机变量是离散的还是连续的。
### 一、离散型随机变量 (Discrete Random Variable)
如果一个随机变量 $X$ 只能取有限个或可数无限个不同的值 $x_1, x_2, \ldots, x_n, \ldots$,其对应的概率分别为 $p_1, p_2, \ldots, p_n, \ldots$,其中 $p_i = P(X=x_i)$,那么 $X$ 的数学期望 $E[X]$ 定义为:
$$ E[X] = \sum_{i} x_i P(X=x_i) = \sum_{i} x_i p_i $$
这个公式的本质是一个 加权平均 。与普通算术平均不同,每个可能的值 $x_i$ 都被其出现的概率 $p_i$ 所加权。概率越大的值,在期望值的计算中占据的比重就越大。
示例:掷一个公平的六面骰子 令随机变量 $X$ 为掷出骰子的点数。 - 可能的值:$\{1, 2, 3, 4, 5, 6\}$ - 每个值出现的概率:由于是公平骰子,每个点数出现的概率都是 $1/6$。 - 计算期望值: $$ E[X] = 1 \cdot \frac{1}{6} + 2 \cdot \frac{1}{6} + 3 \cdot \frac{1}{6} + 4 \cdot \frac{1}{6} + 5 \cdot \frac{1}{6} + 6 \cdot \frac{1}{6} = \frac{1+2+3+4+5+6}{6} = \frac{21}{6} = 3.5 $$ - 解释:这个结果 3.5 意味着,如果你反复掷这枚骰子无数次,记录下每次的点数,然后计算所有这些点数的平均值,这个平均值将会趋近于 3.5。值得注意的是,期望值本身不一定是随机变量的一个可能取值(骰子不可能掷出3.5点)。
### 二、连续型随机变量 (Continuous Random Variable)
如果一个随机变量 $X$ 可以取某一区间内的任意值,我们用{{{概率密度函数}}} (Probability Density Function, PDF) $f(x)$ 来描述其概率分布。此时,$X$ 的数学期望 $E[X]$ 定义为:
$$ E[X] = \int_{-\infty}^{\infty} x f(x) \, dx $$
这个定义是离散情况的自然延伸,求和符号 $\sum$ 变成了积分符号 $\int$,概率值 $P(X=x_i)$ 变成了概率密度 $f(x)$ 与微小区间 $dx$ 的乘积。积分的范围覆盖了 $X$ 所有可能取值的区间。
示例:均匀分布 假设一个随机变量 $X$ 在区间 $[a, b]$ 上服从{{{均匀分布}}}。其概率密度函数为: $$ f(x) = \begin{cases} \frac{1}{b-a} & \text{if } a \le x \le b \\ 0 & \text{otherwise} \end{cases} $$ - 计算期望值: $$ E[X] = \int_a^b x \cdot \frac{1}{b-a} \, dx = \frac{1}{b-a} \left[ \frac{1}{2}x^2 \right]_a^b = \frac{1}{b-a} \cdot \frac{b^2 - a^2}{2} = \frac{(b-a)(b+a)}{2(b-a)} = \frac{a+b}{2} $$ - 解释:对于一个在 $[a, b]$ 上均匀分布的随机变量,其期望值恰好是区间的中点。这非常符合直觉。
## 数学期望的性质
数学期望具有一些非常重要的性质,这些性质极大地简化了相关计算。假设 $X$ 和 $Y$ 是两个随机变量,$a$ 和 $b$ 是常数。
1. 常数的期望:一个常数 $c$ 的期望就是它本身。 $$ E[c] = c $$
2. 线性性质 (Linearity of Expectation):这是期望最重要的性质。 - $E[aX] = a E[X]$ - $E[X + Y] = E[X] + E[Y]$ - 综合起来:$E[aX + bY] = aE[X] + bE[Y]$
一个极其关键的点是,加法法则 $E[X+Y] = E[X]+E[Y]$ 成立,无论 $X$ 和 $Y$ 是否是{{{独立随机变量}}}。这使得期望的计算异常强大和便捷。
3. 乘法性质:如果 $X$ 和 $Y$ 是 {{{独立随机变量}}},那么它们乘积的期望等于它们各自期望的乘积。 $$ E[XY] = E[X] E[Y] \quad \text{(当 X 和 Y 相互独立时)} $$ 注意:如果 $X$ 和 $Y$ 不独立,此式一般不成立。{{{协方差}}} $Cov(X, Y) = E[XY] - E[X]E[Y]$ 正是衡量这种差异的指标。
4. 函数的期望 (LOTUS - Law of the Unconscious Statistician):如果要计算随机变量的某个函数 $g(X)$ 的期望,不需要先求出 $g(X)$ 的概率分布,可以直接使用 $X$ 的分布进行计算。 - 离散情况:$E[g(X)] = \sum_i g(x_i) P(X=x_i)$ - 连续情况:$E[g(X)] = \int_{-\infty}^{\infty} g(x) f(x) \, dx$
例如,计算 $X^2$ 的期望(即{{{二阶矩}}}): $E[X^2] = \int_{-\infty}^{\infty} x^2 f(x) \, dx$。这对于计算{{{方差}}} $Var(X) = E[X^2] - (E[X])^2$ 至关重要。
## 在学科中的应用
- {{{金融学}}}:在资产定价中,一项投资的{{{预期收益率}}} (Expected Return) 就是其未来可能收益的数学期望。投资者根据预期收益率和{{{风险}}}(通常用{{{方差}}}或{{{标准差}}}衡量)来构建{{{投资组合}}}。例如,{{{资本资产定价模型}}} (CAPM) 就是围绕着资产的预期收益率建立的。
- {{{保险学}}}:保险公司在设定保费时,必须精确计算每份保单的期望赔付金额。例如,一份人寿保险的保费必须高于被保险人在保险期内死亡的概率乘以保额(即期望赔付)。通过汇集大量保单,根据{{{大数定律}}},总的实际赔付会非常接近总的期望赔付,从而保证公司的盈利能力。
- {{{决策理论}}}:在不确定性下做决策时,一个理性的决策者通常会选择那个能使其“期望效用”最大化的选项。{{{期望效用理论}}} (Expected Utility Theory) 假设人们的决策目标不是最大化期望货币价值,而是最大化从这些价值中获得的主观满足感(即{{{效用}}})的期望。
- {{{统计推断}}}:在参数估计中,我们希望估计量是{{{无偏}}}的。一个{{{估计量}}} $\hat{\theta}$ 如果其数学期望等于真实参数 $\theta$(即 $E[\hat{\theta}] = \theta$),则称其为{{{无偏估计量}}}。例如,{{{样本均值}}}是总体均值的无偏估计量。