ARTICLE

I类错误

I类错误 (Type I Error) I类错误（Type I Error），又称第一类错误或假阳性错误（False Positive），是假设检验理论中的核心概念，指在零假设 H_0 实际为真的情况下，依据样本数据错误地拒绝零假设的决策错误。I类错误代表了一种"无中生有"的统计推断谬误——研究者从随机噪声中"发现"了实际上并不存在的效应或差异。其发生概率用

浏览 0 更新 2025-10-26

I类错误 (Type I Error)

I类错误（Type I Error），又称第一类错误或假阳性错误（False Positive），是假设检验理论中的核心概念，指在零假设 $H_0$ 实际为真的情况下，依据样本数据错误地拒绝零假设的决策错误。I类错误代表了一种"无中生有"的统计推断谬误——研究者从随机噪声中"发现"了实际上并不存在的效应或差异。其发生概率用显著性水平 $\alpha$ 表示，是研究者在设计实验时预先设定的风险管理参数。理解I类错误的本质、控制机制及其与其他错误类型（尤其是II类错误）之间的权衡关系，是正确运用统计推断方法的前提。

定义与数学表述

在假设检验的决策框架中，研究者面对两个相互对立的假设：零假设 $H_0$ （通常代表"无效应"或"无差异"的默认立场）和备择假设 $H_1$ （代表研究者试图证实的效应）。基于样本数据计算检验统计量，并与临界值比较后，研究者做出"不拒绝 $H_0$ "或"拒绝 $H_0$ "的二元决策。这一过程面临四种可能的决策结果：

\begin{array}{c|cc} \& $\text{不拒绝 }$ $H_0$ \& $\text{拒绝 }$ $H_0$ \\ \hline $H_0$ $\text{ 为真}$ \& $\text{正确决策（概率 }$ 1- $\alpha$ $\text{）}$ \& I类错误（概率 $\alpha$ $\text{）}$ \\ $H_0$ $\text{ 为假}$ \& $\text{II类错误（概率 }$ $\beta$ $\text{）}$ \& $\text{正确决策（概率 }$ 1- $\beta$ $\text{）}$ \end{array}

表中清晰地展示了I类错误的发生条件：当零假设在现实世界中确实为真，但样本数据的随机波动恰好使检验统计量落入拒绝域时，研究者会错误地得出"存在显著效应"的结论。I类错误的概率用 $\alpha = P(\text{拒绝 } H_0 \mid H_0 \text{ 为真})$ 来定义，该概率完全由研究者主观选定，与样本数据无关。常用的 $\alpha$ 取值包括 0.05、0.01 和 0.10，分别代表研究者允许在每 20 次、100 次或 10 次检验中最多犯一次I类错误的风险容忍度。

显著性水平的本质与选择依据

显著性水平 $\alpha$ 是研究者预先设定的I类错误概率上限，是统计推断中控制风险的核心工具。从频数学派统计学的视角看，若研究者从同一总体中重复抽样并反复进行假设检验，在每次检验中以 $\alpha = 0.05$ 为决策标准，则长期来看，在零假设为真的所有检验中，大约有 5\% 的检验会导致错误拒绝。这一性质使 $\alpha$ 成为衡量检验"保守程度"的标尺： $\alpha$ 越小，检验越保守，越不容易错误地声称发现效应，但代价是更难检测到真实存在的效应。

选择 $\alpha$ 的取值需要考虑研究领域的具体规范和错误后果的严重性。在药物临床试验中，监管机构通常要求 $\alpha = 0.05$ （双边），因为I类错误意味着批准一种实际上无效甚至有害的药物上市，后果极其严重。在基因组学关联研究中，由于涉及数百万次并行检验，需使用 Bonferroni 校正或错误发现率（FDR）控制，将单次检验的 $\alpha$ 降至极低水平（如 $5\times10^{-8}$ ）。而在探索性社会科学研究中， $\alpha = 0.05$ 或 0.10 较为常见，研究者更注重发现新颖效应以供后续验证。

I类错误与II类错误的权衡

在给定样本量的条件下，I类错误概率 $\alpha$ 与II类错误概率 $\beta$ （即漏检真实效应的概率）之间存在此消彼长的权衡关系。降低 $\alpha$ 意味着将拒绝域向分布尾部收缩，使拒绝零假设的门槛提高，从而减少误报风险；但与此同时，当真实效应确实存在时，检验统计量落入拒绝域的概率也会降低，即统计检验力（ $1-\beta$ ）下降，遗漏真实效应的风险上升。反之，若将 $\alpha$ 提高（如从 0.01 放宽至 0.05），拒绝域随之扩大，检验力提升，但误报风险相应增加。

这种权衡关系贯穿于整个假设检验理论体系，是研究者在设计实验时必须面对的决策困境。增大样本量是同时降低 $\alpha$ 和 $\beta$ 的最有效途径，因为更大的样本量能够缩小抽样分布的离散程度，使零假设和备择假设对应的分布重叠区域减小，从而提高检验的区分能力。在样本量固定的约束下，研究者需要根据两类错误的相对成本做出审慎抉择：若I类错误的代价远高于II类错误（如药物审批），则应选取较小的 $\alpha$ ；反之，若遗漏真实效应的代价更为严重（如疾病筛查），则可接受相对较高的 $\alpha$ 。

多重比较中的I类错误膨胀

当研究者同时进行多次假设检验时，每次检验各自承担 $\alpha$ 水平的I类错误风险，族系I类错误率（Familywise Error Rate, FWER）将随检验次数的增加而急剧膨胀。若进行 $m$ 次独立的检验且每次均以 $\alpha = 0.05$ 为标准，至少发生一次I类错误的概率为 $1 - (1 - \alpha)^m$ 。当 $m = 10$ 时，该概率约为 0.40；当 $m = 100$ 时，高达 0.994——几乎必定至少出现一次错误显著的结果。

为控制多重比较中的I类错误膨胀，统计学家发展了多种校正方法。Bonferroni 校正是最简单且最保守的方法，将每次检验的显著性水平调整为 $\alpha / m$ ，从而保证族系I类错误率不超过 $\alpha$ 。该方法虽然计算简便，但在检验次数较多时过于保守，可能导致检验力大幅下降。Šidák 校正提供了更为精确的调整公式 $1 - (1 - \alpha)^{1/m}$ ，效果略优于 Bonferroni。Holm–Bonferroni 校正采用逐步递进的方式，在控制 FWER 的同时提高了检验力。对于需要平衡发现率与误报率的研究场景，Benjamini–Hochberg 程序控制错误发现率（FDR），允许以预期中一定比例的假阳性为代价换取更多的真实发现，在基因组学和神经影像学领域得到了广泛应用。

实际应用中的注意事项

在实际研究中，正确管理I类错误风险需要研究者注意以下几个关键问题。第一，检验方向的完整性：单边检验将全部 $\alpha$ 集中于分布的一侧，在特定方向上具有更高的检验力，但研究者必须在数据收集前基于充分理论依据确定方向，事后改为单边检验会实质性地将I类错误率翻倍至 $2\alpha$ 。第二，多重比较的透明报告：在涉及多次检验的研究中，必须明确报告所应用的校正方法及调整后的显著性水平，避免仅报告达到显著的结果而隐瞒未经校正的多重比较。

第三，p 值的正确解读：p 值并不直接给出零假设为真的概率，而是在零假设为真的前提下观测到当前结果（或更极端结果）的概率。当 $p \le \alpha$ 时，研究者在预先设定的I类错误容忍度下拒绝零假设，而非"零假设为真的概率低于 5\%"。第四，探索性与验证性研究的区分：在探索性分析中，研究者可以容忍较高的I类错误率以发现潜在效应，但所发现的效应必须在独立数据的验证性检验中经受更严格的 $\alpha$ 控制。最后，效应量与置信区间应始终与 p 值一并报告，仅凭"显著"或"不显著"的二元结论不足以全面反映研究发现的科学意义。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。