ARTICLE

连续性校正

连续性校正 连续性校正(Continuity Correction)是在用连续概率分布近似离散概率分布时,对统计量进行的一项调整,以弥补离散与连续之间的差异。最经典的应用是卡方检验中的Yates 连续性校正,以及在正态分布近似二项分布时的连续性校正因子。这一校正的理论根源在于:离散随机变量只能取整数,而连续分布在整个实数区间都有概率质量,直接将离散概率用连续

浏览 0 更新 2025-10-26

连续性校正

连续性校正(Continuity Correction)是在用连续概率分布近似离散概率分布时,对统计量进行的一项调整,以弥补离散与连续之间的差异。最经典的应用是卡方检验中的Yates 连续性校正,以及在正态分布近似二项分布时的连续性校正因子。这一校正的理论根源在于:离散随机变量只能取整数,而连续分布在整个实数区间都有概率质量,直接将离散概率用连续曲线替代会引入系统性偏差。

理论基础:从离散到连续

考虑一个取非负整数值的离散随机变量 XX。当我们用连续随机变量 YY 近似 XX 时,对任意整数 kk,离散概率 P(X=k)P(X = k) 在连续框架下对应的是区间概率:

P(X=k)P(k12<Y<k+12)P(X = k) \approx P\left(k - \frac{1}{2} < Y < k + \frac{1}{2}\right)

同理,累积概率的近似为:

P(Xk)P(Y<k+12),P(Xk)P(Y>k12)P(X \leq k) \approx P\left(Y < k + \frac{1}{2}\right), \quad P(X \geq k) \approx P\left(Y > k - \frac{1}{2}\right)

这里的 ±12\pm\frac{1}{2} 就是连续性校正因子,本质是将整数点扩展为以该点为中心、宽度为 1 的区间。这种处理源自中心极限定理的局部极限形式:当样本量足够大时,二项随机变量标准化后的分布函数逐点收敛于标准正态分布函数,但在边界整数点上,离散与连续的差距不可忽视。

Yates 校正:2×2列联表的经典处理

2×22 \times 2 列联表独立性检验中,Pearson卡方统计量定义为:

χ2=i=12j=12(OijEij)2Eij\chi^2 = \sum_{i=1}^{2}\sum_{j=1}^{2} \frac{(O_{ij} - E_{ij})^2}{E_{ij}}

其中 OijO_{ij} 为观测频数,EijE_{ij}期望频数。Yates(1934)提出,由于频数是离散整数而卡方分布是连续的,应对每个单元格的偏差进行校正:

χYates2=i=12j=12(OijEij0.5)2Eij\chi^2_{\text{Yates}} = \sum_{i=1}^{2}\sum_{j=1}^{2} \frac{(|O_{ij} - E_{ij}| - 0.5)^2}{E_{ij}}

即在每个偏差的绝对值上减去 0.5 后再平方。这种操作相当于在计算 P 值时降低了统计量的数值,使得拒绝原假设的门槛更高,检验更加保守

然而,Yates 校正的争议颇大。批评者指出:当样本量较小或期望频数较低时,Yates 校正会导致第II类错误率显著上升,检验功效大幅下降。相比之下,Fisher精确检验在小样本场景下更为可靠。现代统计实践(如循证医学中的荟萃分析)往往建议:预期频数大于 5 时直接用 Pearson 卡方即可;小于 5 时换用 Fisher 精确检验,而非机械施加 Yates 校正。

二项分布正态近似中的校正

XBinomial(n,p)X \sim \operatorname{Binomial}(n, p),当 npnpn(1p)n(1-p) 均不小于 5 时,可用正态分布近似:

Xnpnp(1p)dN(0,1)\frac{X - np}{\sqrt{np(1-p)}} \xrightarrow{d} \mathcal{N}(0, 1)

在计算具体概率时,连续性校正的运用如下:

P(Xk)Φ(k+0.5npnp(1p))P(X \leq k) \approx \Phi\left(\frac{k + 0.5 - np}{\sqrt{np(1-p)}}\right)
P(Xk)1Φ(k0.5npnp(1p))P(X \geq k) \approx 1 - \Phi\left(\frac{k - 0.5 - np}{\sqrt{np(1-p)}}\right)

其中 Φ\Phi 为标准正态分布函数。例如,抛掷硬币 20 次,要近似计算出现至少 15 次正面的概率,校正后的正态近似在 nn 不太大时显著优于未校正版本。

其他场景与扩展

连续性校正的思想远不止于卡方检验。在Wilcoxon秩和检验中,由于秩是离散的,正态近似时同样需要 ±0.5 的校正项。在生存分析Log-rank检验中,当风险集较小时,类似的连续性校正能提高近似精度。更广义地,凡是用矩法或似然比统计量做推断,且检验统计量的精确分布是离散而参考分布是连续时,连续性校正都可作为一种二阶修正手段,通过调整统计量弱化分布尾部的不匹配。

值得注意的是,现代计算能力的提升使得精确推断(exact inference)和置换检验越来越普遍,连续性校正的实用价值有所下降。但它在教科书和统计软件(如R语言的 \texttt{prop.test()} 中默认启用 Yates 校正)中依然广泛存在。理解连续性校正,本质上是理解统计近似与精确推断之间的张力——任何近似方法都需要在简洁与精度之间做出权衡,而 ±0.5 不过是在离散的整数世界与连续的分析世界之间架起的一座朴素的桥梁。