ARTICLE
零假设 (Null Hypothesis, $H_0$)
零假设 (Null Hypothesis, H_0) 零假设 (Null Hypothesis),记为 H_0,是假设检验中作为检验基准的初始陈述,通常代表无效应、无差异或现状 (status quo)。在频率学派统计推断框架下,零假设是一个被预设为真、直至样本数据提供充分反证才予以拒绝的命题。其名称源自早期农业实验中的"零处理" (null treatme
零假设 (Null Hypothesis, )
零假设 (Null Hypothesis),记为 ,是假设检验中作为检验基准的初始陈述,通常代表无效应、无差异或现状 (status quo)。在频率学派统计推断框架下,零假设是一个被预设为真、直至样本数据提供充分反证才予以拒绝的命题。其名称源自早期农业实验中的"零处理" (null treatment) 概念——即对照组接受无效处理,以衡量实验处理的真实效果。
符号表示与数学形式
零假设通常以等式或不等式的形式表达总体参数的特征。设 为待检验的总体参数, 为某一特定值,常见的零假设形式包括:
- 点假设 (Point Hypothesis):,如 ,检验总体均值是否等于零。
- 单侧假设 (One-sided Hypothesis): 或 ,用于方向性检验。
- 联合假设 (Joint Hypothesis):,同时在回归分析中检验多个参数是否全为零。
在Neyman-Pearson引理框架中,零假设与备择假设 构成一个二元决策问题。二者必须互斥且穷举:若参数空间为 ,则 且 。
选择零假设的原则
零假设的选取并非任意,而是基于一套方法论原则。
第一,将研究者希望推翻的命题设为 。 频率学派逻辑类似于"有罪推定"的逆向——以无罪为 ,检方需提供充分证据才能推翻。类似地,研究者希望证明的效应通常被置于 ,而将"无效应"设为 ,使得结论具有保守性。
第二,零假设应使检验统计量的抽样分布可计算。 在似然比检验和拉格朗日乘子检验中,零假设下的参数约束使统计量的渐近分布得以确定。例如在下,t统计量服从t分布,自由度为 。
第三,零假设应包含等号。 在经典假设检验中,显著性水平 定义为 ,因此 必须是一个"简单"或"复合但边界明确"的假设,使得第一类错误概率可计算。如果 是复合的(如 ),则显著性水平取最不利情形下的最大值。
与备择假设的关系
零假设与备择假设 共同定义了检验问题的两端。Fisher 的显著性检验仅使用 ,计算 值作为数据与 不相容程度的度量;而Neyman-Pearson 框架则明确指定 ,以控制第二类错误 () 并最大化检验功效 (Power, )。在实证应用中,研究者通常同时报告 值和功效分析,以兼顾证据强度与决策风险。
一个常见的误区是认为"不拒绝 "等于"接受 "。严格而言,不拒绝零假设 (fail to reject ) 仅表示样本证据不足以否定 ,而非证明 为真。正如统计学家 George Box 所言:"所有模型都是错的,但有些是有用的。"——零假设可能永远不是严格真实的,但它在方法论上充当了一个可证伪的基准。
应用实例
例如,在Chow检验中,零假设为模型参数在两个子样本期间保持稳定:
若 统计量对应的 值小于 0.05,则拒绝参数稳定性假定,认为存在结构性断点。
常见误解与注意事项
零假设在应用中常被误用。统计显著不等于实际显著: 在大样本下即使微小效应也能产生极小 值,但效应量可能毫无实际意义。多重比较问题: 同时检验多个零假设会膨胀第一类错误率,需使用Bonferroni校正或错误发现率 (FDR) 控制。零假设不能因数据驱动设定: 在观测数据后再决定 属于"数据窥探",会严重扭曲推断有效性。
零假设是现代统计推断的基石之一。它通过提供一个可证伪的基准框架,使得研究者能够以系统化、可重复的方式进行科学推理——这正是计量经济学和实证经济学方法论的核心所在。