ARTICLE

Bonferroni校正

Bonferroni校正 (Bonferroni Correction) Bonferroni校正 (Bonferroni Correction) 是一种控制族系错误率 (Family-Wise Error Rate, FWER) 的经典方法，用于解决多重比较 (Multiple Comparisons) 问题。当研究者同时对多个假设进行统计检验时，即使所有

浏览 6 更新 2026-07-11

Bonferroni校正 (Bonferroni Correction)

Bonferroni校正 (Bonferroni Correction) 是一种控制族系错误率 (Family-Wise Error Rate, FWER) 的经典方法，用于解决多重比较 (Multiple Comparisons) 问题。当研究者同时对多个假设进行统计检验时，即使所有零假设都为真，至少出现一次假阳性（犯第一类错误）的概率也会随着检验数量 $m$ 的增加而迅速膨胀。具体而言，若每次检验独立且均以显著性水平 $\alpha$ 进行，则至少一次错误拒绝的概率为 $1 - (1 - \alpha)^m$ ，当 $m = 20$ 、 $\alpha = 0.05$ 时，该概率已高达约 64\%。Bonferroni校正通过在每次检验中使用更严格的标准来将整体 FWER 控制在 $\alpha$ 以下。

校正方法

Bonferroni校正的核心思路极为简洁：将期望控制的整体显著性水平 $\alpha$ 平均分配给所有 $m$ 个检验。具体操作有两种等价形式：

调整显著性水平：将每次检验的显著性水平设为 $\alpha / m$ 。只有当某检验的 $p$ 值小于 $\alpha / m$ 时，才拒绝对应的零假设。

调整 $p$ 值：将原始 $p$ 值乘以检验次数 $m$ ，得到 Bonferroni 校正 $p$ 值，即 $p_i^{\text{Bonf}} = \min(m \cdot p_i, 1)$ 。若 $p_i^{\text{Bonf}} \leq \alpha$ ，则拒绝 $H_0^{(i)}$ 。

该校正以确保整体 FWER 不超过 $\alpha$ 为目标。其数学基础是布尔不等式 (Boole's Inequality)：

\text{FWER} = P\left(\bigcup_{i=1}^{m} \{p_i \leq \alpha/m\}\right) \leq \sum_{i=1}^{m} P(p_i \leq \alpha/m) \leq m \cdot \frac{\alpha}{m} = \alpha

值得注意的是，Bonferroni校正不要求各检验之间相互独立，对任意相关结构都保持 FWER 控制，这使得其适用范围极广。

Holm-Bonferroni 逐步下降法

原始 Bonferroni校正因其极端的保守性（等价于将所有检验一视同仁地采用最严格标准）而损失大量统计功效。Holm-Bonferroni 方法 (Holm, 1979) 提供了一种一致更优的改进，亦称为逐步下降 (step-down) 过程：

将 $m$ 个 $p$ 值从小到大排序： $p_{(1)} \leq p_{(2)} \leq \cdots \leq p_{(m)}$ ，对应零假设 $H_0^{(1)}, H_0^{(2)}, \cdots, H_0^{(m)}$ 。
对于 $k = 1, 2, \cdots, m$ ，若 $p_{(k)} > \frac{\alpha}{m - k + 1}$ ，则接受 $H_0^{(k)}, H_0^{(k+1)}, \cdots, H_0^{(m)}$ 并停止；否则拒绝 $H_0^{(k)}$ 并继续。

Holm 方法同样将 FWER 控制在 $\alpha$ 以下，但比 Bonferroni 校正具有更高的功效，因为后续检验的门槛随已拒绝假设数量的增加而逐步放宽（分母从 $m$ 递减至 $m - k + 1$ ）。

与 Šidák 校正的关系

另一种密切相关的 FWER 控制方法为 Šidák 校正：将每次检验的显著性水平设为 $\alpha_{\text{Šidák}} = 1 - (1 - \alpha)^{1/m}$ 。当检验相互独立时，Šidák 校正精确地将 FWER 控制在 $\alpha$ ，且略优于 Bonferroni（因 $\alpha_{\text{Šidák}} \geq \alpha/m$ ）。然而，Šidák 校正依赖于独立性假设，在检验相关的场景下可能失效，而 Bonferroni 校正无此限制，因此实际应用中 Bonferroni 更为常用。

局限性与替代方法

Bonferroni校正的主要缺陷在于过度保守，尤其当检验数量 $m$ 很大时（如全基因组关联研究 GWAS 中 $m$ 可达数百万）， $\alpha/m$ 极小，几乎不可能检测到任何真实效应，导致第二类错误概率急剧升高。

一种更温和的替代思路是控制错误发现率 (False Discovery Rate, FDR)，即错误拒绝的检验占所有被拒绝检验的期望比例。Benjamini-Hochberg 方法 (1995) 是 FDR 控制的经典方法，在探索性研究中——如基因组学、神经影像学和计量经济学中涉及大量变量筛选的场景——往往比 Bonferroni 校正更受欢迎，因为它在控制假阳性的同时保留了更多发现真效应的能力。

在经济学与社会科学中的应用

在实证经济学中，Bonferroni校正常出现在以下场景：

多重结果变量检验：当一项干预实验同时考察多个结果变量（如收入、健康、教育等）时，需校正以避免"摘樱桃" (cherry-picking) 式报告。
子组分析：若对样本按性别、年龄、地区等维度拆分为多个子组分别检验，校正可减少虚假显著发现。
多期事件研究：在事件研究法 (Event Study) 中同时检验多个时间窗口的异常收益时，可应用 Bonferroni 或 Holm 校正。
稳健性检验：当大量稳健性检验同时进行时，校正有助于区分真正的稳健结论与偶然显著结果。

需要注意的是，Bonferroni校正并非放之四海皆准的教条。其保守性意味着在实际应用中需在控制假阳性与保持统计功效之间做出权衡。近年来的计量经济学方法论讨论中，越来越多的学者建议根据研究目的选择适当的调整方法——确证性研究倾向于 FWER 控制（如 Bonferroni），而探索性研究可考虑 FDR 控制（如 Benjamini-Hochberg）。

\begin{thebibliography}{99}

\bibitem{bonferroni1936} Bonferroni, C. E. (1936). Teoria statistica delle classi e calcolo delle probabilità. Pubblicazioni del R Istituto Superiore di Scienze Economiche e Commerciali di Firenze, 8, 3--62.

\bibitem{holm1979} Holm, S. (1979). A Simple Sequentially Rejective Multiple Test Procedure. Scandinavian Journal of Statistics, 6(2), 65--70.

\bibitem{benjamini1995} Benjamini, Y., \& Hochberg, Y. (1995). Controlling the False Discovery Rate: A Practical and Powerful Approach to Multiple Testing. Journal of the Royal Statistical Society: Series B, 57(1), 289--300.

\end{thebibliography}

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。