ARTICLE
II型错误
II型错误 (Type II Error, ) II型错误 (Type II Error),又称 错误 或 取伪错误,是 统计假设检验 框架中与 第一类错误 并列的两类决策错误之一。它指当 零假设 (H_0) 实际上为假时,检验却未能拒绝 H_0——即"放过了一个错误的原假设"。通俗地说,II型错误是"漏报"(false negative):真实存在的效应或
II型错误 (Type II Error, )
II型错误 (Type II Error),又称 错误 或 取伪错误,是 统计假设检验 框架中与 第一类错误 并列的两类决策错误之一。它指当 零假设 () 实际上为假时,检验却未能拒绝 ——即"放过了一个错误的原假设"。通俗地说,II型错误是"漏报"(false negative):真实存在的效应或差异没有被检测出来。
假设检验决策矩阵中的位置
在假设检验的四种可能决策结果中,II型错误占据如下位置(行=决策,列=真相):
\begin{tabular}{c|c|c} \& 为真 \& 为假 \\ \hline 不拒绝 \& 正确(置信水平 ) \& II型错误(概率 ) \\ \hline 拒绝 \& 第一类错误(概率 ) \& 正确(功效 ) \\ \end{tabular}
犯II型错误的概率记为 ,其补数 即为检验的 统计功效 (Statistical Power)——当备择假设为真时正确拒绝 的概率。
影响 的因素
II型错误概率并非固定值,而是受多个因素共同影响:
效应量 (Effect Size)。真实效应越大,越容易被检测到, 越小。例如,若新药的真实疗效远优于安慰剂,则"漏报"的概率极低;若疗效微乎其微,则 可能很高。
样本量 ()。样本量越大,估计越精确,抽样分布越集中, 随之下降。这是实验设计中 样本量计算 的核心逻辑:为确保足够的功效,研究者需事先确定最小样本量。
显著性水平 ()。降低 (使拒绝标准更严格)会同时降低第一类错误概率和功效,从而增加 。这是两类错误之间经典权衡 (trade-off) 的数学根源。
检验方向。在相同条件下,单侧检验 比 双侧检验 功效更高( 更小),因为拒绝域集中在参数偏离的一个方向上。
与第一类错误的权衡
II型错误与 第一类错误 之间存在根本性的此消彼长关系:在样本量固定的前提下,降低 必然抬高 ,反之亦然。这种权衡要求研究者在设计阶段就根据两类错误的相对代价做出取舍。
典型场景:在药品安全性评估中,第一类错误(批准无效甚至有害的药物)代价远高于II型错误(错过有效药物),因此选择较小的 (如 0.01),接受较高的 。而在探索性研究中,漏掉真实效应 (II型错误) 的代价可能更大,研究者可能接受较高的 (如 0.10)以保持足够功效。
打破这一权衡的唯一有效途径是 增大样本量——同时降低 和 。
经济学与计量经济学中的实例
在 计量经济学 中,II型错误直接影响政策推断。例如评估某项就业培训政策的效果时,设 (政策无效)。若培训确实有效但样本量过小或测量噪声过大,检验未能拒绝 ,便犯了II型错误——研究者错误地得出"政策无效"的结论,可能导致有价值的政策被放弃。
在 有效市场假说 检验中,II型错误表现为未能检测到市场异常收益。在 格兰杰因果检验 中,若 X 确实能预测 Y 但检验不显著,则漏报了真实的预测关系。这些场景的共同教训是:不拒绝 不等于 为真,低功效的检验可能仅仅因为样本不足而掩盖了真实效应。因此,报告检验结果时应同时报告功效分析或置信区间,而非仅依赖单一的"显著/不显著"二分判断。
功效分析中的实际计算
给定显著性水平 、样本量 和预期效应量 ,II型错误概率 可通过非中心分布计算。以单样本双侧 检验 对 为例,当真值为 时:
其中 为标准正态累积分布函数, 为双侧临界值。该公式直观展示了 随样本量 和效应量 增大而递减,随 减小而递增的数量关系。在应用研究中,常用 等软件在实验设计阶段就预先计算所需样本量,以确保功效 达到 0.80 这一惯例阈值。