ARTICLE

Bonferroni校正

Bonferroni校正 (Bonferroni Correction) Bonferroni校正 (Bonferroni Correction) 是一种控制族系错误率 (Family-Wise Error Rate, FWER) 的经典方法,用于解决多重比较 (Multiple Comparisons) 问题。当研究者同时对多个假设进行统计检验时,即使所有

浏览 6 更新 2026-07-11

Bonferroni校正 (Bonferroni Correction)

Bonferroni校正 (Bonferroni Correction) 是一种控制族系错误率 (Family-Wise Error Rate, FWER) 的经典方法,用于解决多重比较 (Multiple Comparisons) 问题。当研究者同时对多个假设进行统计检验时,即使所有零假设都为真,至少出现一次假阳性(犯第一类错误)的概率也会随着检验数量 mm 的增加而迅速膨胀。具体而言,若每次检验独立且均以显著性水平 α\alpha 进行,则至少一次错误拒绝的概率为 1(1α)m1 - (1 - \alpha)^m,当 m=20m = 20α=0.05\alpha = 0.05 时,该概率已高达约 64\%。Bonferroni校正通过在每次检验中使用更严格的标准来将整体 FWER 控制在 α\alpha 以下。

校正方法

Bonferroni校正的核心思路极为简洁:将期望控制的整体显著性水平 α\alpha 平均分配给所有 mm 个检验。具体操作有两种等价形式:

调整显著性水平:将每次检验的显著性水平设为 α/m\alpha / m。只有当某检验的 pp 值小于 α/m\alpha / m 时,才拒绝对应的零假设。

调整 pp:将原始 pp 值乘以检验次数 mm,得到 Bonferroni 校正 pp 值,即 piBonf=min(mpi,1)p_i^{\text{Bonf}} = \min(m \cdot p_i, 1)。若 piBonfαp_i^{\text{Bonf}} \leq \alpha,则拒绝 H0(i)H_0^{(i)}

该校正以确保整体 FWER 不超过 α\alpha 为目标。其数学基础是布尔不等式 (Boole's Inequality):

FWER=P(i=1m{piα/m})i=1mP(piα/m)mαm=α\text{FWER} = P\left(\bigcup_{i=1}^{m} \{p_i \leq \alpha/m\}\right) \leq \sum_{i=1}^{m} P(p_i \leq \alpha/m) \leq m \cdot \frac{\alpha}{m} = \alpha

值得注意的是,Bonferroni校正不要求各检验之间相互独立,对任意相关结构都保持 FWER 控制,这使得其适用范围极广。

Holm-Bonferroni 逐步下降法

原始 Bonferroni校正因其极端的保守性(等价于将所有检验一视同仁地采用最严格标准)而损失大量统计功效Holm-Bonferroni 方法 (Holm, 1979) 提供了一种一致更优的改进,亦称为逐步下降 (step-down) 过程:

  1. mmpp 值从小到大排序:p(1)p(2)p(m)p_{(1)} \leq p_{(2)} \leq \cdots \leq p_{(m)},对应零假设 H0(1),H0(2),,H0(m)H_0^{(1)}, H_0^{(2)}, \cdots, H_0^{(m)}
  2. 对于 k=1,2,,mk = 1, 2, \cdots, m,若 p(k)>αmk+1p_{(k)} > \frac{\alpha}{m - k + 1},则接受 H0(k),H0(k+1),,H0(m)H_0^{(k)}, H_0^{(k+1)}, \cdots, H_0^{(m)} 并停止;否则拒绝 H0(k)H_0^{(k)} 并继续。

Holm 方法同样将 FWER 控制在 α\alpha 以下,但比 Bonferroni 校正具有更高的功效,因为后续检验的门槛随已拒绝假设数量的增加而逐步放宽(分母从 mm 递减至 mk+1m - k + 1)。

与 Šidák 校正的关系

另一种密切相关的 FWER 控制方法为 Šidák 校正:将每次检验的显著性水平设为 αSˇidaˊk=1(1α)1/m\alpha_{\text{Šidák}} = 1 - (1 - \alpha)^{1/m}。当检验相互独立时,Šidák 校正精确地将 FWER 控制在 α\alpha,且略优于 Bonferroni(因 αSˇidaˊkα/m\alpha_{\text{Šidák}} \geq \alpha/m)。然而,Šidák 校正依赖于独立性假设,在检验相关的场景下可能失效,而 Bonferroni 校正无此限制,因此实际应用中 Bonferroni 更为常用。

局限性与替代方法

Bonferroni校正的主要缺陷在于过度保守,尤其当检验数量 mm 很大时(如全基因组关联研究 GWAS 中 mm 可达数百万),α/m\alpha/m 极小,几乎不可能检测到任何真实效应,导致第二类错误概率急剧升高。

一种更温和的替代思路是控制错误发现率 (False Discovery Rate, FDR),即错误拒绝的检验占所有被拒绝检验的期望比例。Benjamini-Hochberg 方法 (1995) 是 FDR 控制的经典方法,在探索性研究中——如基因组学神经影像学计量经济学中涉及大量变量筛选的场景——往往比 Bonferroni 校正更受欢迎,因为它在控制假阳性的同时保留了更多发现真效应的能力。

在经济学与社会科学中的应用

在实证经济学中,Bonferroni校正常出现在以下场景:

  • 多重结果变量检验:当一项干预实验同时考察多个结果变量(如收入、健康、教育等)时,需校正以避免"摘樱桃" (cherry-picking) 式报告。
  • 子组分析:若对样本按性别、年龄、地区等维度拆分为多个子组分别检验,校正可减少虚假显著发现。
  • 多期事件研究:在事件研究法 (Event Study) 中同时检验多个时间窗口的异常收益时,可应用 Bonferroni 或 Holm 校正。
  • 稳健性检验:当大量稳健性检验同时进行时,校正有助于区分真正的稳健结论与偶然显著结果。

需要注意的是,Bonferroni校正并非放之四海皆准的教条。其保守性意味着在实际应用中需在控制假阳性与保持统计功效之间做出权衡。近年来的计量经济学方法论讨论中,越来越多的学者建议根据研究目的选择适当的调整方法——确证性研究倾向于 FWER 控制(如 Bonferroni),而探索性研究可考虑 FDR 控制(如 Benjamini-Hochberg)。

\begin{thebibliography}{99}

\bibitem{bonferroni1936} Bonferroni, C. E. (1936). Teoria statistica delle classi e calcolo delle probabilità. Pubblicazioni del R Istituto Superiore di Scienze Economiche e Commerciali di Firenze, 8, 3--62.

\bibitem{holm1979} Holm, S. (1979). A Simple Sequentially Rejective Multiple Test Procedure. Scandinavian Journal of Statistics, 6(2), 65--70.

\bibitem{benjamini1995} Benjamini, Y., \& Hochberg, Y. (1995). Controlling the False Discovery Rate: A Practical and Powerful Approach to Multiple Testing. Journal of the Royal Statistical Society: Series B, 57(1), 289--300.

\end{thebibliography}