ARTICLE

零假设

零假设 (Null Hypothesis) 零假设 (Null Hypothesis),在 统计学 中通常以 H_0 表示,是 假设检验 (Hypothesis Testing) 的基石。它是关于 总体 (Population) 参数 (Parameter) 的陈述,核心思想为"无效应"或"无差异"。研究者设零假设作为需通过 样本 数据挑战的默认立场。 与零

浏览 30 更新 2025-10-26

零假设 (Null Hypothesis)

零假设 (Null Hypothesis),在 统计学 中通常以 H0H_0 表示,是 假设检验 (Hypothesis Testing) 的基石。它是关于 总体 (Population) 参数 (Parameter) 的陈述,核心思想为"无效应"或"无差异"。研究者设零假设作为需通过 样本 数据挑战的默认立场。

与零假设相对的是 备择假设 (Alternative Hypothesis),用 H1H_1HaH_a 表示,代表研究者希望证明的"有效应"或"有差异"的陈述。假设检验的本质是收集证据评估是否有足够理由推翻零假设、支持备择假设。

零假设的构建原则

零假设的构建遵循以下基本原则:

  1. 陈述的性质:零假设总是关于总体参数(如总体 均值 μ\mu、总体比例 pp 或两个总体参数之差)的陈述,而非关于样本统计量。
  2. 包含等号:零假设的数学形式必然包含等式关系(==, \le, 或 \ge)。这一设定提供了一个确切的数值,使得我们能够在 H0H_0 为真的前提下计算观察到特定样本结果的 概率
  3. 作为被挑战的对象:零假设代表现状、普遍接受的观点或一种无特定关系的状态,科学研究的目的正是挑战这种现状。

构建示例

  1. 医学研究(新药降压效果): \[ H_0: \mu_{\text{新药}} = \mu_{\text{安慰剂}}, \quad H_1: \mu_{\text{新药}} \neq \mu_{\text{安慰剂}} \]
  2. 经济学(政策对失业率的影响): \[ H_0: \mu_{\text{实施后}} = \mu_{\text{实施前}}, \quad H_1: \mu_{\text{实施后}} \neq \mu_{\text{实施前}} \]
  3. 生产管理(零件直径是否符合标准 5cm): \[ H_0: \mu = 5, \quad H_1: \mu \neq 5 \]

假设检验的逻辑过程

假设检验的逻辑可类比法庭"无罪推定"原则:零假设如同"被告无罪"的初始假定,检方须提供足够证据来推翻它。检验分为以下步骤:

  1. 设定假设:明确陈述 H0H_0H1H_1
  2. 设定显著性水平 α\alpha:即愿意承担的"弃真"风险,通常取 0.050.05, 0.010.010.100.10
  3. 假定 H0H_0 为真:作为整个推断过程的逻辑起点。
  4. 计算检验统计量:从总体抽取 随机样本,计算如 zz 值、tt 值或 χ2\chi^2 值等 检验统计量,衡量样本与零假设预期的偏离。
  5. 计算 p 值:在 H0H_0 为真的前提下,获得当前样本结果或更极端结果的概率。很小的 p值 意味着零假设为真时该结果极不可能发生。
  6. 做出决策: \begin{itemize}
  7. pαp \le \alpha:拒绝零假设 (Reject H0H_0),结果被称为 统计显著的 (Statistically Significant)。
  8. p>αp > \alpha:未能拒绝零假设 (Fail to Reject H0H_0),即当前样本数据没有提供足够强的证据来推翻它。 \end{itemize}

关键概念辨析

"未能拒绝"不等于"接受"

这是统计推断中最易误解的概念。我们永远不说"接受零假设"。"未能拒绝"仅意味着当前数据未能提供足够证据推翻它——正如法庭"证据不足、无罪释放"不等同于证明被告"绝对清白"。由于样本随机性,零假设可能实际为假但我们恰巧抽到了无法揭示该错误的样本。

p 值不是 H0H_0 为真的概率

p 值是在假定 H0H_0 为真的条件下观察到当前样本结果的条件概率,即 P(DataH0)P(\text{Data} \mid H_0),绝非零假设本身为真的概率 P(H0Data)P(H_0 \mid \text{Data})。这是频率派与 贝叶斯统计 的根本区分:频率派视参数为固定常数,概率仅来自数据随机性;贝叶斯派允许对参数赋予概率分布。

两类错误

基于样本信息对总体做推断时,存在两种可能的错误:

  • 第一类错误 (Type I Error)弃真——H0H_0 本身正确却被拒绝。发生概率即显著性水平 α\alpha: \[ P(\text{Reject } H_0 \mid H_0 \text{ is true}) = \alpha \]
  • 第二类错误 (Type II Error)存伪——H0H_0 本身错误却未能被拒绝。发生概率以 β\beta 表示: \[ P(\text{Fail to Reject } H_0 \mid H_0 \text{ is false}) = \beta \]

研究者通常在控制 α\alpha 的前提下尽可能降低 β\beta,即最大化 统计功效 (Statistical Power, 1β1 - \beta)。零假设的设立为科学方法论提供了客观、可重复的框架,用以评估新发现是否仅源于随机巧合。