知经 KNOWECON · 卓越的经济金融统计数学学习平台

数学期望与方差的计算

# 数学期望与方差的计算 (Calculation of Mathematical Expectation and Variance)

在{{{概率论}}}和{{{统计学}}}中,数学期望 (Mathematical Expectation) 与 方差 (Variance) 是描述一个{{{随机变量}}} (Random Variable) 分布特征的两个最核心的数字特征。数学期望衡量了随机变量取值的“中心趋势”或“平均水平”,而方差则度量了随机变量取值在其中心周围的“离散程度”或“波动大小”。掌握它们的计算方法是进行统计推断、金融建模和风险评估等众多应用领域的基础。

本讲义将系统地介绍离散型和连续型两种随机变量的数学期望与方差的定义、计算公式及核心性质。

## 一. 数学期望 (Mathematical Expectation)

数学期望,通常记为 $E(X)$ 或 $\mu$,是一个随机变量所有可能取值按其出现概率加权的平均值。它揭示了随机变量在大量重复试验中的长期平均表现。计算方法依据随机变量的类型而有所不同。

### 1. {{{离散型随机变量}}} (Discrete Random Variable) 的期望

对于一个离散型随机变量 $X$,其所有可能的取值为 $x_1, x_2, \dots, x_n, \dots$,对应的{{{概率}}}分别为 $P(X=x_1), P(X=x_2), \dots, P(X=x_n), \dots$。其数学期望定义为: $$ E(X) = \sum_{i} x_i P(X=x_i) $$ 这个公式的本质是一个加权平均数,其中每个取值 $x_i$ 的“权重”就是它发生的概率 $P(X=x_i)$。

示例:掷一个公平的六面骰子 设随机变量 $X$ 为掷出骰子的点数。 可能取值 $x_i$ 为 $\{1, 2, 3, 4, 5, 6\}$。 由于骰子是公平的,每个点数出现的概率 $P(X=x_i)$ 均为 $\frac{1}{6}$。 根据公式,其数学期望为: $$ E(X) = 1 \cdot \frac{1}{6} + 2 \cdot \frac{1}{6} + 3 \cdot \frac{1}{6} + 4 \cdot \frac{1}{6} + 5 \cdot \frac{1}{6} + 6 \cdot \frac{1}{6} = \frac{1+2+3+4+5+6}{6} = \frac{21}{6} = 3.5 $$ 注意:计算出的期望值 3.5 自身并不是一个可能的掷骰结果。它代表的是,如果我们进行无数次掷骰子试验,所有结果的平均值将趋近于 3.5。

### 2. {{{连续型随机变量}}} (Continuous Random Variable) 的期望

对于一个连续型随机变量 $X$,其行为由{{{概率密度函数}}} (Probability Density Function, PDF) $f(x)$ 描述。其数学期望定义为: $$ E(X) = \int_{-\infty}^{\infty} x f(x) dx $$ 此处的积分是离散情况下求和的自然延伸。它计算了所有可能取值 $x$ 与其微小邻域概率密度 $f(x)dx$ 乘积的累加。

示例:{{{均匀分布}}} (Uniform Distribution) 假设随机变量 $X$ 在区间 $[a, b]$ 上服从均匀分布。 其概率密度函数为: $f(x) = \begin{cases} \frac{1}{b-a}, & \text{if } a \le x \le b \\ 0, & \text{otherwise} \end{cases}$ 根据公式,其数学期望为: $$ E(X) = \int_a^b x \cdot \frac{1}{b-a} dx = \frac{1}{b-a} \left[ \frac{1}{2}x^2 \right]_a^b = \frac{1}{b-a} \cdot \frac{b^2 - a^2}{2} = \frac{(b-a)(b+a)}{2(b-a)} = \frac{a+b}{2} $$ 这个结果符合直觉:一个在区间上均匀分布的变量,其平均值就是该区间的中点。

### 3. 期望的性质 (Properties of Expectation)

期望具有非常重要的线性性质,这使得计算变得简单。设 $X$ 和 $Y$ 是两个随机变量,$a, b, c$ 是常数。

* 常数的期望:$E(c) = c$ * 线性运算: * $E(aX) = aE(X)$ * $E(X+b) = E(X) + b$ * 综合起来:$E(aX+b) = aE(X) + b$ * 期望的可加性:$E(X+Y) = E(X) + E(Y)$ * 这个性质极其强大,因为它对任何两个随机变量都成立,无论它们是否{{{独立}}}。 * 推广到多个变量:$E(aX + bY) = aE(X) + bE(Y)$。

## 二. 方差 (Variance)

方差,通常记为 $Var(X)$、 $D(X)$ 或 $\sigma^2$,衡量的是随机变量 $X$ 的取值与其数学期望 $E(X)$ 的偏离程度。方差越大,说明数据点越分散;方差越小,说明数据点越集中。

### 1. 方差的定义

方差被定义为随机变量与期望之差的平方的期望值。设 $\mu = E(X)$: $$ Var(X) = E \left[ (X - \mu)^2 \right] $$ 这个定义有两个关键点: * $(X-\mu)$:计算每个值与均值的偏差。 * 平方:将偏差平方,使得正负偏差不会相互抵消,并且对较大的偏差给予更高的“惩罚”。

### 2. 方差的计算公式

根据随机变量类型的不同,基于定义的计算公式如下:

* 离散型随机变量: $$ Var(X) = \sum_{i} (x_i - \mu)^2 P(X=x_i) $$ * 连续型随机变量: $$ Var(X) = \int_{-\infty}^{\infty} (x - \mu)^2 f(x) dx $$

### 3. 一个更实用的计算公式

虽然定义式在理论上很重要,但在实际计算中,通常使用一个等价的计算公式,因为它往往能简化计算过程: $$ Var(X) = E(X^2) - [E(X)]^2 $$ 推导过程: 令 $\mu = E(X)$。 $Var(X) = E[(X-\mu)^2] = E[X^2 - 2\mu X + \mu^2]$ 根据期望的线性性质: $= E(X^2) - E(2\mu X) + E(\mu^2)$ 由于 $\mu$ 和 $2$ 都是常数: $= E(X^2) - 2\mu E(X) + \mu^2$ 将 $\mu = E(X)$ 代回: $= E(X^2) - 2[E(X)][E(X)] + [E(X)]^2$ $= E(X^2) - [E(X)]^2$

这个公式的含义是“随机变量平方的期望减去期望的平方”。

示例:再次计算掷骰子的方差 我们已经知道 $E(X) = 3.5$。现在使用计算公式 $Var(X) = E(X^2) - [E(X)]^2$。 首先,计算 $E(X^2)$: $$ E(X^2) = 1^2 \cdot \frac{1}{6} + 2^2 \cdot \frac{1}{6} + 3^2 \cdot \frac{1}{6} + 4^2 \cdot \frac{1}{6} + 5^2 \cdot \frac{1}{6} + 6^2 \cdot \frac{1}{6} $$ $$ E(X^2) = \frac{1+4+9+16+25+36}{6} = \frac{91}{6} $$ 然后,计算方差: $$ Var(X) = E(X^2) - [E(X)]^2 = \frac{91}{6} - (3.5)^2 = \frac{91}{6} - (7/2)^2 = \frac{91}{6} - \frac{49}{4} $$ $$ Var(X) = \frac{182 - 147}{12} = \frac{35}{12} \approx 2.917 $$ 此方法通常比使用定义式逐项计算 $(x_i - \mu)^2$ 更为快捷。

### 4. 方差的性质 (Properties of Variance)

设 $X$ 和 $Y$ 是两个随机变量,$a, b, c$ 是常数。

* 非负性:$Var(X) \ge 0$。方差永远不为负。 * 常数的方差:$Var(c) = 0$。一个常数没有任何波动,因此方差为零。 * 位移不变性:$Var(X+b) = Var(X)$。将所有数据点平移一个常数,其离散程度不变。 * 尺度变换:$Var(aX) = a^2 Var(X)$。将随机变量乘以一个常数 $a$,其方差会乘以 $a^2$。 * 线性变换的通用公式:$Var(aX+b) = a^2Var(X)$。 * 随机变量和的方差: * 如果 $X$ 和 $Y$ 是{{{独立}}}的随机变量,则:$$ Var(X+Y) = Var(X) + Var(Y) $$ * 如果 $X$ 和 $Y$ 不独立,则公式更为复杂,需要引入{{{协方差}}} (Covariance):$Var(X+Y) = Var(X) + Var(Y) + 2Cov(X,Y)$。这是期望和方差性质的一个关键区别。

## 三. 标准差 (Standard Deviation)

尽管方差在数学上很方便,但它的单位是原始数据单位的平方(例如,如果 $X$ 的单位是米,则 $Var(X)$ 的单位是平方米),这使得其在直观解释上存在困难。为了解决这个问题,我们引入了标准差

{{{标准差}}} (Standard Deviation),通常记为 $\sigma(X)$ 或 $\sigma$,被定义为方差的算术平方根: $$ \sigma(X) = \sqrt{Var(X)} $$ 标准差的单位与原始随机变量和其期望的单位相同,因此它提供了一个关于数据“平均偏离均值”多少的更直观的度量。例如,在掷骰子的例子中,标准差为 $\sigma(X) = \sqrt{35/12} \approx 1.708$。

## 学习要点总结

| 特征 | 数学期望 $E(X)$ | 方差 $Var(X)$ | | --- | --- | --- | | 含义 | 随机变量的中心趋势、平均值 | 随机变量的离散程度、波动大小 | | 离散型计算 | $ \sum x_i P(X=x_i) $ | $ E(X^2) - [E(X)]^2 $ | | 连续型计算 | $ \int x f(x) dx $ | $ E(X^2) - [E(X)]^2 $ | | 线性变换 $aX+b$ | $ aE(X)+b $ | $ a^2Var(X) $ | | 变量求和 $X+Y$ | $ E(X)+E(Y) $ (始终成立) | $ Var(X)+Var(Y) $ (仅在 $X,Y$ 独立时成立) |