ARTICLE

棣莫弗-拉普拉斯定理

棣莫弗-拉普拉斯定理 (De Moivre-Laplace Theorem) 棣莫弗-拉普拉斯定理是概率论中一个里程碑式的极限定理,它断言:当试验次数 n 充分大时,参数为 (n, p) 的二项分布可以用正态分布来近似。具体而言,若 X_n Binomial(n, p) ,则对任意固定的 a < b ,有: 其中 ( ) 为标准正态分布的累积分布函数。该定理

浏览 1 更新 2026-05-25

棣莫弗-拉普拉斯定理 (De Moivre-Laplace Theorem)

棣莫弗-拉普拉斯定理是概率论中一个里程碑式的极限定理,它断言:当试验次数 n n 充分大时,参数为 (n,p) (n, p) 的二项分布可以用正态分布来近似。具体而言,若 XnBinomial(n,p) X_n \sim \operatorname{Binomial}(n, p) ,则对任意固定的 a<b a < b ,有:

limnP(aXnnpnp(1p)b)=12πabex2/2dx=Φ(b)Φ(a)\lim_{n \to \infty} P\left(a \leq \frac{X_n - np}{\sqrt{np(1-p)}} \leq b\right) = \frac{1}{\sqrt{2\pi}} \int_a^b e^{-x^2/2} \, dx = \Phi(b) - \Phi(a)

其中 Φ() \Phi(\cdot) 为标准正态分布的累积分布函数。该定理是中心极限定理最早被严格证明的特殊情形,标志着从离散概率到连续概率的历史性跨越。

历史溯源

定理的名称源于两位在不同世纪做出贡献的数学家。1733年,法国数学家棣莫弗 (Abraham de Moivre) 在《机遇的学说》第二版中首次提出了二项分布的正态近似思想,并推导出正态曲线 12πex2/2 \frac{1}{\sqrt{2\pi}} e^{-x^2/2} 作为二项分布的极限形式。当时棣莫弗处理的仅是 p=12 p = \frac{1}{2} 的对称情形。一个多世纪后,拉普拉斯 (Pierre-Simon Laplace) 于1812年在《概率的分析理论》中将该结果推广到任意 p(0,1) p \in (0, 1) ,并给出了更严格的数学论证。因此完整定理被称为棣莫弗-拉普拉斯定理。

从历史视角看,该定理先于一般形式的中心极限定理出现约一个世纪,为高斯误差理论和最小二乘法的概率基础铺平了道路。拉普拉斯本人在论证行星轨道误差的正态性时,直接诉诸了这一定理的逻辑:大量独立微小扰动的叠加近似正态。

局部极限与积分极限

棣莫弗-拉普拉斯定理有两种等价表述:

局部极限定理 (Local Limit Theorem)

XnBinomial(n,p) X_n \sim \operatorname{Binomial}(n, p) ,令 k k 为整数满足 k=np+xnp(1p) k = np + x\sqrt{np(1-p)} ,则当 n n \to \infty 时:

P(Xn=k)12πnp(1p)exp((knp)22np(1p))P(X_n = k) \sim \frac{1}{\sqrt{2\pi np(1-p)}} \exp\left(-\frac{(k - np)^2}{2np(1-p)}\right)

即二项概率的精确值可由正态密度除以 np(1p) \sqrt{np(1-p)} 来逼近。该结果直接给出了单个概率质量在极限下的渐近行为。

积分极限定理 (Integral Limit Theorem)

即前述的标准化累积分布收敛于 Φ \Phi 。这是应用中最常使用的形式:当需要计算 P(αXnβ) P(\alpha \leq X_n \leq \beta) n n 较大时,可对标准化后的区间求正态概率。实践中常用连续性校正 (continuity correction) 提高精度:将 P(αXnβ) P(\alpha \leq X_n \leq \beta) 近似为 Φ(β+0.5npnp(1p))Φ(α0.5npnp(1p)) \Phi(\frac{\beta + 0.5 - np}{\sqrt{np(1-p)}}) - \Phi(\frac{\alpha - 0.5 - np}{\sqrt{np(1-p)}})

与中心极限定理的关系

棣莫弗-拉普拉斯定理是林德伯格-莱维中心极限定理 (Lindeberg-Lévy CLT) 的特例。将二项随机变量 Xn X_n 表示为 n n 个独立同分布的伯努利随机变量之和 Xn=i=1nYi X_n = \sum_{i=1}^n Y_i ,其中 YiBernoulli(p) Y_i \sim \operatorname{Bernoulli}(p) E[Yi]=p \mathbb{E}[Y_i] = p Var(Yi)=p(1p) \operatorname{Var}(Y_i) = p(1-p) 。林德伯格-莱维定理直接给出标准化和的渐近正态性。然而棣莫弗-拉普拉斯定理的历史先于一般理论,且其初等证明(使用斯特林公式直接展开阶乘)具有独特的教学价值,无需测度论或特征函数工具。

此外,棣莫弗-拉普拉斯定理在收敛速度上有更精细的估计。贝里-埃塞恩定理 (Berry-Esseen Theorem) 给出了二项分布逼近正态的均匀误差界:

supxRP(Xnnpnp(1p)x)Φ(x)C(p2+(1p)2)np(1p)\sup_{x \in \mathbb{R}} \left| P\left(\frac{X_n - np}{\sqrt{np(1-p)}} \leq x\right) - \Phi(x) \right| \leq \frac{C \cdot (p^2 + (1-p)^2)}{\sqrt{np(1-p)}}

其中 C C 为通用常数(最小已知值约为 0.4748)。当 p p 接近 0 或 1 时,收敛变慢,此时应用泊松极限定理 (Poisson limit theorem) 更为合适。

应用条件与注意事项

经验准则:一般建议当 np5 np \geq 5 n(1p)5 n(1-p) \geq 5 (或更保守的 np(1p)10 np(1-p) \geq 10 )时,正态近似是可靠的。当 p p 远离 1/2 1/2 时,需要更大的 n n 。若准则不满足,说明分布偏度较大,正态近似将产生显著误差。

连续性校正:由于二项分布是离散的而正态分布是连续的,直接用正态密度替代概率质量会产生系统性偏差。连续性校正通过将整数 k k 对应到区间 (k0.5,k+0.5) (k-0.5, k+0.5) 来补偿这一差异,对于中等大小的 n n (如 20n100 20 \leq n \leq 100 )尤其重要;当 n n 极大时校正效应减弱。

适用范围:该定理仅适用于独立同伯努利试验。对于不等概率、相依试验或有限总体抽样,应分别使用林德伯格-费勒定理或超几何分布的正态近似(需额外满足有限总体修正因子)。

在统计与科学中的应用

棣莫弗-拉普拉斯定理是现代统计推断的基石之一:

  • 置信区间:Wald 置信区间 pp^±zα/2p^(1p^)/n p \approx \hat{p} \pm z_{\alpha/2}\sqrt{\hat{p}(1-\hat{p})/n} 直接依赖二项比例的正态近似。
  • 假设检验:二项检验中,Z=(p^p0)/p0(1p0)/n Z = (\hat{p} - p_0)/\sqrt{p_0(1-p_0)/n} 在大样本下近似 N(0,1) N(0, 1) ,这是比例检验的理论依据。
  • 样本量确定:在调查设计和临床试验中,基于正态近似计算所需样本量是标准做法。
  • 统计质量控制休哈特控制图中的 p p -图 (p-chart) 利用正态近似设定控制限。
  • 金融风险建模:违约率模型中,当贷款组合规模较大时,违约数的分布可用正态近似,构成巴斯尔协议信用风险参数估计的数学基础。

证明概要

经典证明基于斯特林公式 n!2πn(n/e)n n! \sim \sqrt{2\pi n}(n/e)^n 。将二项概率质量函数展开:

P(Xn=k)=(nk)pk(1p)nkP(X_n = k) = \binom{n}{k} p^k (1-p)^{n-k}

k=np+xnp(1p) k = np + x\sqrt{np(1-p)} ,代入斯特林公式并对 logP(Xn=k) \log P(X_n = k) 做泰勒展开,经过代数消去后得到核心近似:

P(Xn=k)12πnp(1p)exp(x22)P(X_n = k) \approx \frac{1}{\sqrt{2\pi np(1-p)}} \exp\left(-\frac{x^2}{2}\right)

k k 在由 a a b b 确定的区间上求和,利用黎曼和的收敛性,即得积分极限定理。拉普拉斯的原始论证本质上即为这种方式,现代教材中仍广泛沿用。