ARTICLE

连续性修正

连续性修正 (Continuity Correction) 连续性修正(Continuity Correction)是统计学与概率论中改善离散概率分布以连续分布近似时精度的重要技术。使用正态分布近似二项分布或泊松分布等离散分布时,离散变量的概率质量集中于孤立点上,而连续变量的概率密度散布于连续区间,直接近似会导致系统性误差。连续性修正通过将离散值的概率质量对

浏览 16 更新 2025-11-11

连续性修正 (Continuity Correction)

连续性修正(Continuity Correction)是统计学概率论中改善离散概率分布以连续分布近似时精度的重要技术。使用正态分布近似二项分布泊松分布等离散分布时,离散变量的概率质量集中于孤立点上,而连续变量的概率密度散布于连续区间,直接近似会导致系统性误差。连续性修正通过将离散值的概率质量对应到适当调整的连续区间,显著提高近似准确性,在样本量中等或计算分布尾部概率时效果尤为明显。

原理与经典示例

半单位校正是连续性修正的核心形式。离散分布的整数值k对应的概率质量,映射为连续分布中从 k0.5k-0.5k+0.5k+0.5 的区间积分。若二项分布 B(n,p)B(n,p) 用正态 N(np,np(1p))N(np, np(1-p)) 近似,要近似 P(Xk)P(X \le k)(离散版为精确k及以下值的概率),连续近似应使用 P(Z(k+0.5np)/np(1p))P(Z \le (k+0.5-np)/\sqrt{np(1-p)}),即对k加上0.5。近似 P(Xk)P(X \ge k) 时,连续性修正使用 P(Z(k0.5np)/np(1p))P(Z \ge (k-0.5-np)/\sqrt{np(1-p)}),即k减去0.5。近似 P(X=k)P(X = k) 时,使用 P(k0.5<Z<k+0.5)P(k-0.5 < Z < k+0.5) 区间。

连续性修正源自De Moivre-Laplace定理(二项极限定理)的细化。早期统计学家对此有重要贡献,Yates修正由Frank Yates于1934年提出,专用于卡方检验中的2×2列联表。当期望频数较小时,连续性修正能够降低第I类错误率,但可能导致过度保守。在当代实际中,连续修正的使用存在争议,Fisher精确检验常常取代连续性修正的近似检验。在计算手工时代,连续性修正不可或缺;当代计算工具可直接计算精确二项概率,连续性修正在教学和历史中的价值仍然重要,帮助理解离散到连续跨接的误差来源。