ARTICLE

原假设

原假设 (Null Hypothesis) 原假设 (Null Hypothesis),在学术文献中通常记为 H_0,是 推断统计学 中 假设检验 (Hypothesis Testing) 框架的基石。它是一个关于 总体参数 (Population Parameter) 的陈述,通常代表着"没有效应"、"没有差异"或"维持现状"的立场。研究者通常希望通过收集

浏览 57 更新 2025-10-25

原假设 (Null Hypothesis)

原假设 (Null Hypothesis),在学术文献中通常记为 H0H_0,是 推断统计学假设检验 (Hypothesis Testing) 框架的基石。它是一个关于 总体参数 (Population Parameter) 的陈述,通常代表着"没有效应"、"没有差异"或"维持现状"的立场。研究者通常希望通过收集 样本 数据来推翻原假设,从而证明他们所提出的理论(即 备择假设)成立。

原假设在科学探究中扮演着类似"无罪推定"中"假定无罪"的角色。统计检验的目的不是去"证明"原假设正确,而是评估样本证据是否有足够力量来拒绝原假设。

原假设与备择假设

在任何假设检验中,都存在一对互斥且穷尽的假设:原假设 H0H_0备择假设 (Alternative Hypothesis) H1H_1HaH_a

原假设是试图用证据反驳的陈述,总是包含等号(==\le\ge)。例如:新药没有效果、两种教学方法的平均得分相同、一个变量与另一个变量不相关。

H0:μ1=μ2H0:ρ=0H0:p0.5H_0: \mu_1 = \mu_2 \quad H_0: \rho = 0 \quad H_0: p \ge 0.5

备择假设是当有足够证据拒绝原假设时所接受的陈述,代表研究者真正想证明的观点。备择假设永远不包含等号的纯粹形式。

H1:μ1μ2H1:ρ>0H1:p<0.5H_1: \mu_1 \neq \mu_2 \quad H_1: \rho > 0 \quad H_1: p < 0.5

关键区分:原假设和备择假设是关于未知 总体参数(如 μ\muppρ\rho)的陈述,而非关于 样本统计量(如 xˉ\bar{x}p^\hat{p})的陈述。

假设检验的逻辑

假设检验的核心思路:先假定 H0H_0 为真,然后观察样本数据,问:"如果 H0H_0 为真,观察到这个样本结果(或更极端的)的概率有多大?"

这个概率即 p值 (p-value)

  • 若 p 值很小(通常小于预设的 显著性水平 α\alpha,如 0.05),意味着在 H0H_0 为真时该结果是极不可能的,因此 拒绝原假设
  • 若 p 值较大(大于 α\alpha),则没有足够证据推翻原假设,只能 未能拒绝原假设

法庭类比:原假设为"被告无罪",备择假设为"被告有罪"。拒绝 H0H_0("有罪")需要证据超出合理怀疑,这对应统计上 统计显著 的结果;未能拒绝 H0H_0("无罪")不意味着被告被证明无辜,仅表示证据不足。同样,未能拒绝 H0H_0 不意味 H0H_0 正确,仅表示数据证据不足以反驳它。

检验步骤

  1. 陈述假设:明确写出 H0H_0H1H_1,这决定了检验类型(双尾检验、左尾或右尾)。例如检验某地区大学毕业生平均起薪是否为 60,000 USD:H0:μ=60000H_0: \mu = 60000H1:μ60000H_1: \mu \neq 60000
  2. 设定显著性水平:选择 α\alpha(通常 0.05、0.01 或 0.10),代表愿意承担的 第一类错误 风险。
  3. 计算检验统计量:根据样本数据计算 检验统计量(如 z统计量t统计量卡方统计量),衡量样本统计量与 H0H_0 设定参数之间的标准化差异。对于均值检验: \[ z = \frac{\bar{x} - \mu_0}{\sigma / \sqrt{n}} \] 其中 xˉ\bar{x} 为样本均值,μ0\mu_0 为原假设总体均值,σ\sigma 为总体标准差,nn 为样本量。
  4. 做出统计决策:比较 p 值与 α\alpha(若 pαp \le \alpha 则拒绝 H0H_0),或比较检验统计量与 临界值(若落入 拒绝域 则拒绝 H0H_0)。
  5. 解释结果:在问题背景下用通俗语言解释统计决策,明确是否有足够证据支持备择假设。

两类错误

  • 第一类错误 (Type I Error)H0H_0 为真却错误拒绝("弃真"),发生概率为 α\alpha
  • 第二类错误 (Type II Error)H0H_0 为假却未能拒绝("取伪"),发生概率为 β\beta(1β)(1-\beta) 称为 统计功效,即正确拒绝错误 H0H_0 的概率。

降低一种错误的概率通常会增加另一种错误的风险,选择 α\alpha 是在两者之间权衡。

实例应用

一家制药公司开发新降压药,欲证明其比 安慰剂 更有效。随机抽取 100 名患者,50 人服药,50 人服安慰剂。

  • H0H_0:新药与安慰剂效果相同 (μdrugμplacebo=0\mu_{\text{drug}} - \mu_{\text{placebo}} = 0)。
  • H1H_1:新药优于安慰剂 (μdrugμplacebo>0\mu_{\text{drug}} - \mu_{\text{placebo}} > 0)。

研究人员收集两组血压下降数据,计算 t统计量,得 p 值为 0.02。设定 α=0.05\alpha = 0.05,因 0.02<0.050.02 < 0.05,拒绝 H0H_0。结论:有充分的统计证据表明新药比安慰剂更有效。