ARTICLE

贝里-埃塞恩定理

贝里-埃塞恩定理 (Berry-Esseen Theorem) 贝里-埃塞恩定理(Berry-Esseen Theorem)是概率论中关于中心极限定理收敛速度的经典定量结果。中心极限定理表明独立随机变量之和的标准化分布依分布收敛于正态分布,但未给出收敛速度;贝里-埃塞恩定理则提供了分布函数之间最大绝对偏差的显式上界。该定理由Andrew Berry(1941

浏览 0 更新 2026-01-05

贝里-埃塞恩定理 (Berry-Esseen Theorem)

贝里-埃塞恩定理(Berry-Esseen Theorem)是概率论中关于中心极限定理收敛速度的经典定量结果。中心极限定理表明独立随机变量之和的标准化分布依分布收敛于正态分布,但未给出收敛速度;贝里-埃塞恩定理则提供了分布函数之间最大绝对偏差的显式上界。该定理由Andrew Berry(1941)和Carl-Gustav Esseen(1942)分别独立证明,是边缘分布渐近理论中最基本的非渐近界之一。

定理的精确表述

X1,X2,,XnX_1, X_2, \dots, X_n为独立同分布的随机变量,满足E[Xi]=0\mathbb{E}[X_i] = 0E[Xi2]=σ2>0\mathbb{E}[X_i^2] = \sigma^2 > 0以及E[Xi3]=ρ<\mathbb{E}[|X_i|^3] = \rho < \infty。记标准化部分和为:

Sn=1σni=1nXiS_n = \frac{1}{\sigma\sqrt{n}}\sum_{i=1}^n X_i

其分布函数为Fn(x)=P(Snx)F_n(x) = \mathbb{P}(S_n \le x),标准正态分布函数为Φ(x)\Phi(x)。则存在绝对常数CC,使得对任意nn和任意实数xx有:

supxRFn(x)Φ(x)Cρσ3n\sup_{x \in \mathbb{R}} |F_n(x) - \Phi(x)| \le C \cdot \frac{\rho}{\sigma^3\sqrt{n}}

该上界中的常数CC不依赖于XiX_i的具体分布,也不依赖于nn。多项研究致力于确定CC的最佳可能取值:Esseen最初证明C7.59C \le 7.59;经过van Beek(1972)、Shiganov(1986)等学者的改进,目前已将上界降至C0.4690C \le 0.4690;同时已知C0.4097C \ge 0.4097(取值为XiX_i为对称伯努利分布时的精确极限值),因此最佳常数的范围已缩小至[0.4097,0.4690][0.4097, 0.4690]

非独立同分布情形

XiX_i独立但不必同分布时,定理仍然成立,只需将ρ/σ3\rho/\sigma^3替换为Lindeberg条件下的Lindeberg比值:

supxFn(x)Φ(x)Ci=1nE[Xi3](i=1nE[Xi2])3/2\sup_{x} |F_n(x) - \Phi(x)| \le C \cdot \frac{\sum_{i=1}^n \mathbb{E}[|X_i|^3]}{(\sum_{i=1}^n \mathbb{E}[X_i^2])^{3/2}}

该形式被广泛应用于计量经济学统计学推断非参数统计中的有限样本误差界分析。若三阶矩不存在,则可使用截断技术获得类似但略弱的上界。

多维推广与意义

贝里-埃塞恩定理存在多维情形的推广形式:对Rd\mathbb{R}^d值随机向量,在存在有界三阶矩的条件下,分布函数在矩形集上的偏差被O(n1/2)O(n^{-1/2})控制,但常数依赖于维度dd。该多维版本由BhattacharyaRanga Rao(1976)系统建立,是多元统计分析渐近理论的重要支柱。

该定理在假设检验的有限样本性质分析、Bootstrap方法的理论验证、以及机器学习中置信区间的非渐近构造等领域具有广泛的应用价值。因其为经典极限定理提供了可操作的精度刻画,贝里-埃塞恩定理被视为概率论中连接渐近理论与有限样本理论的核心桥梁之一。