贝里-埃塞恩定理 (Berry-Esseen Theorem)
贝里-埃塞恩定理(Berry-Esseen Theorem)是概率论中关于中心极限定理收敛速度的经典定量结果。中心极限定理表明独立随机变量之和的标准化分布依分布收敛于正态分布,但未给出收敛速度;贝里-埃塞恩定理则提供了分布函数之间最大绝对偏差的显式上界。该定理由Andrew Berry(1941)和Carl-Gustav Esseen(1942)分别独立证明,是边缘分布渐近理论中最基本的非渐近界之一。
定理的精确表述
设X1,X2,…,Xn为独立同分布的随机变量,满足E[Xi]=0、E[Xi2]=σ2>0以及E[∣Xi∣3]=ρ<∞。记标准化部分和为:
Sn=σn1i=1∑nXi
其分布函数为Fn(x)=P(Sn≤x),标准正态分布函数为Φ(x)。则存在绝对常数C,使得对任意n和任意实数x有:
x∈Rsup∣Fn(x)−Φ(x)∣≤C⋅σ3nρ
该上界中的常数C不依赖于Xi的具体分布,也不依赖于n。多项研究致力于确定C的最佳可能取值:Esseen最初证明C≤7.59;经过van Beek(1972)、Shiganov(1986)等学者的改进,目前已将上界降至C≤0.4690;同时已知C≥0.4097(取值为Xi为对称伯努利分布时的精确极限值),因此最佳常数的范围已缩小至[0.4097,0.4690]。
非独立同分布情形
当Xi独立但不必同分布时,定理仍然成立,只需将ρ/σ3替换为Lindeberg条件下的Lindeberg比值:
xsup∣Fn(x)−Φ(x)∣≤C⋅(∑i=1nE[Xi2])3/2∑i=1nE[∣Xi∣3]
该形式被广泛应用于计量经济学、统计学推断和非参数统计中的有限样本误差界分析。若三阶矩不存在,则可使用截断技术获得类似但略弱的上界。
多维推广与意义
贝里-埃塞恩定理存在多维情形的推广形式:对Rd值随机向量,在存在有界三阶矩的条件下,分布函数在矩形集上的偏差被O(n−1/2)控制,但常数依赖于维度d。该多维版本由Bhattacharya和Ranga Rao(1976)系统建立,是多元统计分析渐近理论的重要支柱。
该定理在假设检验的有限样本性质分析、Bootstrap方法的理论验证、以及机器学习中置信区间的非渐近构造等领域具有广泛的应用价值。因其为经典极限定理提供了可操作的精度刻画,贝里-埃塞恩定理被视为概率论中连接渐近理论与有限样本理论的核心桥梁之一。