ARTICLE

零假设 (Null Hypothesis, $H_0$)

零假设 (Null Hypothesis, H_0) 零假设 (Null Hypothesis),记为 H_0,是假设检验中作为检验基准的初始陈述,通常代表无效应、无差异或现状 (status quo)。在频率学派统计推断框架下,零假设是一个被预设为真、直至样本数据提供充分反证才予以拒绝的命题。其名称源自早期农业实验中的"零处理" (null treatme

浏览 0 更新 2026-07-11

零假设 (Null Hypothesis, H0H_0)

零假设 (Null Hypothesis),记为 H0H_0,是假设检验中作为检验基准的初始陈述,通常代表无效应无差异现状 (status quo)。在频率学派统计推断框架下,零假设是一个被预设为真、直至样本数据提供充分反证才予以拒绝的命题。其名称源自早期农业实验中的"零处理" (null treatment) 概念——即对照组接受无效处理,以衡量实验处理的真实效果。

符号表示与数学形式

零假设通常以等式或不等式的形式表达总体参数的特征。设 θ\theta 为待检验的总体参数,θ0\theta_0 为某一特定值,常见的零假设形式包括:

  1. 点假设 (Point Hypothesis):H0:θ=θ0H_0: \theta = \theta_0,如 H0:μ=0H_0: \mu = 0,检验总体均值是否等于零。
  2. 单侧假设 (One-sided Hypothesis):H0:θθ0H_0: \theta \geq \theta_0H0:θθ0H_0: \theta \leq \theta_0,用于方向性检验。
  3. 联合假设 (Joint Hypothesis):H0:β1=β2=0H_0: \beta_1 = \beta_2 = 0,同时在回归分析中检验多个参数是否全为零。

Neyman-Pearson引理框架中,零假设与备择假设 H1H_1 构成一个二元决策问题。二者必须互斥且穷举:若参数空间为 Θ\Theta,则 Θ=Θ0Θ1\Theta = \Theta_0 \cup \Theta_1Θ0Θ1=\Theta_0 \cap \Theta_1 = \varnothing

选择零假设的原则

零假设的选取并非任意,而是基于一套方法论原则。

第一,将研究者希望推翻的命题设为 H0H_0 频率学派逻辑类似于"有罪推定"的逆向——以无罪为 H0H_0,检方需提供充分证据才能推翻。类似地,研究者希望证明的效应通常被置于 H1H_1,而将"无效应"设为 H0H_0,使得结论具有保守性。

第二,零假设应使检验统计量的抽样分布可计算。似然比检验拉格朗日乘子检验中,零假设下的参数约束使统计量的渐近分布得以确定。例如在H0:β=0H_0: \beta = 0下,t统计量服从t分布,自由度为 nkn - k

第三,零假设应包含等号。 在经典假设检验中,显著性水平 α\alpha 定义为 P(拒绝H0H0为真)P(\text{拒绝} H_0 \mid H_0 \text{为真}),因此 H0H_0 必须是一个"简单"或"复合但边界明确"的假设,使得第一类错误概率可计算。如果 H0H_0 是复合的(如 H0:μ0H_0: \mu \leq 0),则显著性水平取最不利情形下的最大值。

与备择假设的关系

零假设与备择假设 H1H_1 共同定义了检验问题的两端。Fisher 的显著性检验仅使用 H0H_0,计算 pp 值作为数据与 H0H_0 不相容程度的度量;而Neyman-Pearson 框架则明确指定 H1H_1,以控制第二类错误 (β\beta) 并最大化检验功效 (Power, 1β1 - \beta)。在实证应用中,研究者通常同时报告 pp 值和功效分析,以兼顾证据强度与决策风险。

一个常见的误区是认为"不拒绝 H0H_0"等于"接受 H0H_0"。严格而言,不拒绝零假设 (fail to reject H0H_0) 仅表示样本证据不足以否定 H0H_0,而非证明 H0H_0 为真。正如统计学家 George Box 所言:"所有模型都是错的,但有些是有用的。"——零假设可能永远不是严格真实的,但它在方法论上充当了一个可证伪的基准。

应用实例

例如,在Chow检验中,零假设为模型参数在两个子样本期间保持稳定:

H0:β1=β2.H_0: \boldsymbol{\beta}_1 = \boldsymbol{\beta}_2.

FF 统计量对应的 pp 值小于 0.05,则拒绝参数稳定性假定,认为存在结构性断点

常见误解与注意事项

零假设在应用中常被误用。统计显著不等于实际显著: 在大样本下即使微小效应也能产生极小 pp 值,但效应量可能毫无实际意义。多重比较问题: 同时检验多个零假设会膨胀第一类错误率,需使用Bonferroni校正错误发现率 (FDR) 控制。零假设不能因数据驱动设定: 在观测数据后再决定 H0H_0 属于"数据窥探",会严重扭曲推断有效性。

零假设是现代统计推断的基石之一。它通过提供一个可证伪的基准框架,使得研究者能够以系统化、可重复的方式进行科学推理——这正是计量经济学实证经济学方法论的核心所在。