ARTICLE

弱大数定律

弱大数定律 (Weak Law of Large Numbers) 弱大数定律 (Weak Law of Large Numbers, WLLN) 是概率论和统计学中的一个基本定理，它以数学方式描述了"大样本平均值趋于稳定"这一直观现象。该定律指出，对于一个随机过程，随着样本数量的增加，其样本均值会越来越接近该过程的真实期望值。这里的"接近"是通过一种特定的

浏览 62 更新 2025-10-26

弱大数定律 (Weak Law of Large Numbers)

弱大数定律 (Weak Law of Large Numbers, WLLN) 是概率论和统计学中的一个基本定理，它以数学方式描述了"大样本平均值趋于稳定"这一直观现象。该定律指出，对于一个随机过程，随着样本数量的增加，其样本均值会越来越接近该过程的真实期望值。这里的"接近"是通过一种特定的收敛模式——依概率收敛 (Convergence in Probability)——来定义的。

弱大数定律是连接理论概率（期望值）和实践统计（样本均值）的关键桥梁，为利用样本推断总体的合理性提供了坚实的数学基础。

定理的正式表述

弱大数定律有多种版本，其条件强度各不相同。我们首先介绍一个基于方差存在的、易于证明的经典版本。

假设 $X_1, X_2, \ldots, X_n$ 是一系列独立同分布 (independent and identically distributed, i.i.d.) 的随机变量。每一个随机变量都具有相同的有限期望值 $E[X_i] = \mu$ 和有限方差 $\text{Var}(X_i) = \sigma^2 < \infty$ 。

定义样本均值 (Sample Mean) 为：

\bar{X}_n = \frac{1}{n} \sum_{i=1}^{n} X_i

弱大数定律表明，对于任意给定的正数 $\epsilon > 0$ （无论多小），样本均值 $\bar{X}_n$ 与总体期望值 $\mu$ 的偏差大于 $\epsilon$ 的概率，会随着样本量 $n$ 的增大而趋向于0。用数学语言表述为：

\lim_{n \to \infty} P(|\bar{X}_n - \mu| > \epsilon) = 0

这个公式的含义是：当你收集了足够多的样本时，样本均值"几乎不可能"偏离真实的总体均值太远。

使用切比雪夫不等式进行证明

弱大数定律的一个直观且经典的证明是利用切比雪夫不等式 (Chebyshev's Inequality)。该证明清晰地展示了样本量 $n$ 如何抑制随机性带来的波动。

证明步骤：

确定样本均值 $\bar{X}_n$ 的期望和方差。

根据期望的线性性质， $\bar{X}_n$ 的期望值为：

E[\bar{X}_n] = E\left[\frac{1}{n}\sum_{i=1}^{n} X_i\right] = \frac{1}{n}\sum_{i=1}^{n} E[X_i] = \frac{1}{n}(n\mu) = \mu

这说明样本均值是总体期望的无偏估计量。

由于各随机变量是独立的， $\bar{X}_n$ 的方差为：

\text{Var}(\bar{X}_n) = \text{Var}\left(\frac{1}{n}\sum_{i=1}^{n} X_i\right) = \frac{1}{n^2}\sum_{i=1}^{n} \text{Var}(X_i) = \frac{1}{n^2}(n\sigma^2) = \frac{\sigma^2}{n}

这个结果至关重要：样本均值的方差与样本量 $n$ 成反比。样本量越大，样本均值的波动性越小。

应用切比雪夫不等式。

切比雪夫不等式指出，对于任何期望为 $E[Y]$ 、方差为 $\text{Var}(Y)$ 的随机变量 $Y$ ，以及任何正数 $k>0$ ，有：

P(|Y - E[Y]| \ge k) \le \frac{\text{Var}(Y)}{k^2}

我们将此不等式应用于随机变量 $Y = \bar{X}_n$ 。我们已知 $E[\bar{X}_n] = \mu$ 和 $\text{Var}(\bar{X}_n) = \sigma^2/n$ 。令 $k = \epsilon$ ，代入不等式可得：

P(|\bar{X}_n - \mu| \ge \epsilon) \le \frac{\text{Var}(\bar{X}_n)}{\epsilon^2} = \frac{\sigma^2/n}{\epsilon^2} = \frac{\sigma^2}{n\epsilon^2}

取极限。

现在，我们考察当样本量 $n$ 趋向于无穷大时的极限：

\lim_{n \to \infty} P(|\bar{X}_n - \mu| > \epsilon) \le \lim_{n \to \infty} \frac{\sigma^2}{n\epsilon^2}

由于 $\sigma^2$ 和 $\epsilon^2$ 都是固定的正数，当 $n \to \infty$ 时，分式 $\frac{\sigma^2}{n\epsilon^2}$ 的极限为 0。又因为概率值不可能是负数，所以我们得到：

\lim_{n \to \infty} P(|\bar{X}_n - \mu| > \epsilon) = 0

证明完毕。

定律的意义与应用

弱大数定律不仅是一个抽象的数学定理，它在许多领域都有着深刻的实际意义。

统计推断的基石：它是参数估计理论的基石。当我们使用样本的平均身高来估计某地区人口的平均身高时，弱大数定律保证了只要样本足够大，我们的估计就有很大概率是准确的。
风险管理与保险：保险公司通过为大量客户提供保险来分散风险。每个客户是否索赔是一个随机事件，但根据弱大数定律，当客户数量极大时，实际的平均赔付金额将非常接近预期的平均赔付金额。这使得保险公司能够精确地计算保费，从而保持盈利和 solvency。这背后的原理是风险分散。
金融学：在投资组合理论中，弱大数定律解释了多元化为何能降低风险。一个包含大量不相关或弱相关资产的投资组合，其回报率的波动性会远小于单个资产。 portfolio 的平均回报率会趋向于其期望回报率。
蒙特卡洛方法：在计算数学和物理学中，当一个量（如定积分）难以解析求解时，可以使用蒙特卡洛方法进行数值模拟。通过产生大量的随机样本并计算其平均值，可以依据弱大数定律得到该量的一个近似值。

与强大数定律的比较

与弱大数定律密切相关的是另一个重要定理——强大数定律 (Strong Law of Large Numbers, SLLN)。两者的主要区别在于收敛的模式。

弱大数定律 (依概率收敛):

\lim_{n \to \infty} P(|\bar{X}_n - \mu| > \epsilon) = 0

它描述的是一个关于概率序列的极限。对于任何一个固定的、巨大的 $n$ ，样本均值偏离期望值的概率非常小。但是，它并不排除在无限的抽样序列中，样本均值偶尔会大幅偏离期望值的可能性。

强大数定律 (几乎必然收敛):

P(\lim_{n \to \infty} \bar{X}_n = \mu) = 1

它描述的是一个关于样本路径的极限。它表明，对于几乎所有（即概率为1）的无限样本序列，样本均值本身这个数列将最终收敛到期望值 $\mu$ 。这是一个比弱大数定律更强的结论。

可以通俗地理解为：

WLLN：你进行无数次"抛掷n次硬币"的独立实验，当 $n$ 很大时，几乎所有实验得到的正面频率都接近 $0.5$ 。
SLLN：你只进行一次"无限抛掷硬币"的实验，你得到的正面频率这个序列，本身就将收敛于 $0.5$ （概率为 1）。

强大数定律通常要求更强的条件或更复杂的证明，但它蕴含了弱大数定律。

条件的放宽：辛钦弱大数定律

我们之前证明的版本要求随机变量具有有限的方差 ( $\sigma^2 < \infty$ )。然而，这个条件可以被放宽。

辛钦弱大数定律 (Khinchin's Weak Law of Large Numbers) 指出，对于一系列独立同分布的随机变量，只要它们的期望值 $E[X_i] = \mu$ 存在且有限，弱大数定律就成立。不再需要方差有限的假设。

这一定理极大地扩展了弱大数定律的适用范围，使其能够应用于某些具有"厚尾"特征的概率分布，例如期望有限但方差无限的帕累托分布。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。