ARTICLE

邦弗伦尼校正

邦弗伦尼校正 (Bonferroni Correction) 邦弗伦尼校正（Bonferroni Correction，亦译为邦费罗尼校正）是一种控制族系错误率（Family-Wise Error Rate, FWER）的经典多重比较校正方法，由意大利数学家卡洛·埃米利奥·邦弗伦尼（Carlo Emilio Bonferroni, 1892–1960）于19

浏览 0 更新 2026-07-14

邦弗伦尼校正 (Bonferroni Correction)

邦弗伦尼校正（Bonferroni Correction，亦译为邦费罗尼校正）是一种控制族系错误率（Family-Wise Error Rate, FWER）的经典多重比较校正方法，由意大利数学家卡洛·埃米利奥·邦弗伦尼（Carlo Emilio Bonferroni, 1892–1960）于1936年提出。该方法的核心思想是将预设的显著性水平 $\alpha$ 按照比较次数进行分割，以约束在同时对多个假设进行统计检验时至少犯一次第一类错误的概率不超过 $\alpha$ 。

问题的来源：多重比较困境

在单次假设检验中，若显著性水平设为 $\alpha = 0.05$ ，则当零假设为真时错误拒绝的概率为 5\%。然而，当研究者同时对 $m$ 个独立的零假设进行检验时，至少出现一次假阳性结果的概率为

P(\text{至少一次错误拒绝}) = 1 - (1 - \alpha)^m.

当 $m = 10$ 时，该概率约为 40\%；当 $m = 20$ 时，高达约 64\%；当 $m = 100$ 时，已接近 99.4\%。这意味着，若不对多重比较加以校正，仅仅因检验数量庞大即可"发现"大量虚假的显著性结果。这一现象在基因组学、神经影像学、计量经济学和临床试验等领域尤为突出，因此多重比较校正成为统计推断中的核心议题之一。

邦弗伦尼校正的原理

邦弗伦尼校正的数学基础是布尔不等式（Boole's Inequality），也称为邦弗伦尼不等式。设事件 $E_i$ 表示第 $i$ 次检验错误拒绝零假设（即 $p_i \leq \alpha/m$ ），则族系错误率为：

\text{FWER} = P\left(\bigcup_{i=1}^{m} E_i\right) \leq \sum_{i=1}^{m} P(E_i) = \sum_{i=1}^{m} \frac{\alpha}{m} = \alpha.

该不等式的优势在于它不要求各检验之间相互独立，不论检验间的相关结构如何，FWER 始终被控制在 $\alpha$ 以下。这一稳健性使邦弗伦尼校正成为适用范围最广的 FWER 控制方法之一。

校正的具体操作有两种等价形式：

调整临界显著性水平：将单次检验的拒绝阈值设为 $\alpha_{\text{adj}} = \alpha / m$ 。仅当检验的 $p$ 值小于 $\alpha/m$ 时，才拒绝对应的零假设。
调整 $p$ 值：将原始 $p$ 值乘以检验总数 $m$ ，得到校正后的 $p$ 值： $p_i^{\text{(Bonf)}} = \min(m \cdot p_i, 1)$ 。若 $p_i^{\text{(Bonf)}} \leq \alpha$ ，则拒绝 $H_0^{(i)}$ 。

与其他校正方法的比较

Holm-Bonferroni 逐步下降法

1979 年，Sture Holm 提出了对原始邦弗伦尼校正的改进——Holm-Bonferroni 法，亦称逐步下降法。其步骤如下：

将 $m$ 个检验的 $p$ 值从小到大排序： $p_{(1)} \leq p_{(2)} \leq \cdots \leq p_{(m)}$ ，记对应的零假设为 $H_0^{(1)}, H_0^{(2)}, \ldots, H_0^{(m)}$ 。
对于 $k = 1, 2, \ldots, m$ ，依次比较 $p_{(k)}$ 与 $\alpha / (m - k + 1)$ ： \begin{itemize}
若 $p_{(k)} \leq \alpha / (m - k + 1)$ ，则拒绝 $H_0^{(k)}$ 并继续检验下一个；
若 $p_{(k)} > \alpha / (m - k + 1)$ ，则接受 $H_0^{(k)}, H_0^{(k+1)}, \ldots, H_0^{(m)}$ 并终止检验。 \end{itemize}

Holm 方法同样控制 FWER 在 $\alpha$ 以下，但在所有情况下的统计功效均不低于（且通常高于）原始邦弗伦尼校正，因为后续检验的门槛随着已拒绝假设的增多而逐步放宽。

加权邦弗伦尼方法

在某些应用场景中，研究者可能认为某些检验比其他检验更重要，因此不愿将各检验一视同仁。 extbf{加权邦弗伦尼方法}（Weighted Bonferroni Procedure）允许为每个检验分配不同的权重 $w_i > 0$ （满足 $\sum_{i=1}^{m} w_i = m$ ），并将单次检验的显著性水平设为 $w_i \cdot \alpha / m$ 。该方法同样将 FWER 控制在 $\alpha$ 以下，同时允许研究者根据先验知识或科学重要性对不同检验分配不同的严格程度。例如，在临床试验中，主要终点指标可被赋予较高权重以保留更多检验功效，而次要终点指标则对应较低的权重。加权邦弗伦尼方法的这一灵活性使其特别适合于那些研究假设具有明确优先级层次结构的实证研究设计。

Šidák 校正

Šidák 校正将单次检验的显著性水平设为 $\alpha_{\text{Š}} = 1 - (1 - \alpha)^{1/m}$ 。当各检验严格独立时，Šidák 校正恰好将 FWER 控制在 $\alpha$ ，且由于 $\alpha_{\text{Š}} \geq \alpha/m$ ，其统计功效略优于邦弗伦尼校正。然而，Šidák 校正对独立性假设的依赖使其在检验之间存在相关性的场景下失效（可能无法实现 FWER 控制），因此在实际应用中邦弗伦尼校正因其无假设限制而更受青睐。

错误发现率控制

当检验数量 $m$ 极大时（如全基因组关联研究中可达数百万次检验），邦弗伦尼校正的 $\alpha/m$ 标准过于严苛，导致统计功效极低，几乎无法检测出任何真实效应。在此类场景下，错误发现率（False Discovery Rate, FDR）控制方法——尤其是Benjamini-Hochberg 方法（1995）——成为更实用的替代方案。FDR 控制的并非"至少一次错误拒绝"的概率，而是错误拒绝的检验占所有被拒绝检验的期望比例，在牺牲一定的 FWER 严格性的同时大幅提升了发现真效应的能力。

应用场景与注意事项

在实证研究中，邦弗伦尼校正的典型应用包括：

多重结果变量检验：在随机对照试验（RCT）中同时评估多个结局指标（如收入、健康、教育、幸福感等），若不校正则极易"摘樱桃"（cherry-picking）式地选择性报告显著结果。
子组分析：在对样本按性别、年龄、地区等维度进行分组比较时，对各组的结果进行校正以避免因多重比较而误报异质性效应。
多重时间窗口分析：在事件研究法中同时检验多个日期窗口的异常收益，或在时间序列分析中同时检验多个滞后期系数。
稳健性检验：当研究者进行大量稳健性检验（如替换变量定义、改变样本区间、调整模型设定等）时，邦弗伦尼校正有助于区分真正稳健的结论与偶然获得的显著结果。

然而，邦弗伦尼校正也因以下局限性受到批评：

过度保守：当检验数量大或检验之间存在正相关时，邦弗伦尼校正的拒绝阈值过于严苛，导致第二类错误（假阴性）概率显著上升。
忽视检验相关性：布尔不等式虽然在所有相关结构下均成立，但当检验高度相关时，该上界远非紧界，校正后的检验过于保守，浪费了大量统计信息。
不提供排序信息：原始邦弗伦尼校正将所有检验一视同仁，忽略了各检验在科学意义上的重要性差异。相比之下，Holm 方法或加权邦弗伦尼方法（Weighted Bonferroni Procedure）可通过赋予不同检验不同的权重来反映其优先级。

\begin{thebibliography}{99}

\bibitem{bonferroni1936} Bonferroni, C. E. (1936). Teoria statistica delle classi e calcolo delle probabilità. Pubblicazioni del R Istituto Superiore di Scienze Economiche e Commerciali di Firenze, 8, 3--62.

\bibitem{holm1979} Holm, S. (1979). A Simple Sequentially Rejective Multiple Test Procedure. Scandinavian Journal of Statistics, 6(2), 65--70.

\bibitem{benjamini1995} Benjamini, Y., \& Hochberg, Y. (1995). Controlling the False Discovery Rate: A Practical and Powerful Approach to Multiple Testing. Journal of the Royal Statistical Society: Series B (Methodological), 57(1), 289--300.

\bibitem{shaffer1995} Shaffer, J. P. (1995). Multiple Hypothesis Testing. Annual Review of Psychology, 46(1), 561--584.

\bibitem{blakesley2009} Blakesley, R. E., et al. (2009). Comparisons of Methods for Multiple Hypothesis Testing in Neuropsychological Research. Neuropsychology, 23(2), 255--264.

\end{thebibliography}

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。