ARTICLE
零假设
零假设 (Null Hypothesis) 零假设 (Null Hypothesis),在 统计学 中通常以 H_0 表示,是 假设检验 (Hypothesis Testing) 的基石。它是关于 总体 (Population) 参数 (Parameter) 的陈述,核心思想为"无效应"或"无差异"。研究者设零假设作为需通过 样本 数据挑战的默认立场。 与零
零假设 (Null Hypothesis)
零假设 (Null Hypothesis),在 统计学 中通常以 表示,是 假设检验 (Hypothesis Testing) 的基石。它是关于 总体 (Population) 参数 (Parameter) 的陈述,核心思想为"无效应"或"无差异"。研究者设零假设作为需通过 样本 数据挑战的默认立场。
与零假设相对的是 备择假设 (Alternative Hypothesis),用 或 表示,代表研究者希望证明的"有效应"或"有差异"的陈述。假设检验的本质是收集证据评估是否有足够理由推翻零假设、支持备择假设。
零假设的构建原则
零假设的构建遵循以下基本原则:
- 陈述的性质:零假设总是关于总体参数(如总体 均值 、总体比例 或两个总体参数之差)的陈述,而非关于样本统计量。
- 包含等号:零假设的数学形式必然包含等式关系(, , 或 )。这一设定提供了一个确切的数值,使得我们能够在 为真的前提下计算观察到特定样本结果的 概率。
- 作为被挑战的对象:零假设代表现状、普遍接受的观点或一种无特定关系的状态,科学研究的目的正是挑战这种现状。
构建示例
- 医学研究(新药降压效果): \[ H_0: \mu_{\text{新药}} = \mu_{\text{安慰剂}}, \quad H_1: \mu_{\text{新药}} \neq \mu_{\text{安慰剂}} \]
- 经济学(政策对失业率的影响): \[ H_0: \mu_{\text{实施后}} = \mu_{\text{实施前}}, \quad H_1: \mu_{\text{实施后}} \neq \mu_{\text{实施前}} \]
- 生产管理(零件直径是否符合标准 5cm): \[ H_0: \mu = 5, \quad H_1: \mu \neq 5 \]
假设检验的逻辑过程
假设检验的逻辑可类比法庭"无罪推定"原则:零假设如同"被告无罪"的初始假定,检方须提供足够证据来推翻它。检验分为以下步骤:
- 设定假设:明确陈述 和 。
- 设定显著性水平 :即愿意承担的"弃真"风险,通常取 , 或 。
- 假定 为真:作为整个推断过程的逻辑起点。
- 计算检验统计量:从总体抽取 随机样本,计算如 值、 值或 值等 检验统计量,衡量样本与零假设预期的偏离。
- 计算 p 值:在 为真的前提下,获得当前样本结果或更极端结果的概率。很小的 p值 意味着零假设为真时该结果极不可能发生。
- 做出决策: \begin{itemize}
- 若 :拒绝零假设 (Reject ),结果被称为 统计显著的 (Statistically Significant)。
- 若 :未能拒绝零假设 (Fail to Reject ),即当前样本数据没有提供足够强的证据来推翻它。 \end{itemize}
关键概念辨析
"未能拒绝"不等于"接受"
这是统计推断中最易误解的概念。我们永远不说"接受零假设"。"未能拒绝"仅意味着当前数据未能提供足够证据推翻它——正如法庭"证据不足、无罪释放"不等同于证明被告"绝对清白"。由于样本随机性,零假设可能实际为假但我们恰巧抽到了无法揭示该错误的样本。
p 值不是 为真的概率
p 值是在假定 为真的条件下观察到当前样本结果的条件概率,即 ,绝非零假设本身为真的概率 。这是频率派与 贝叶斯统计 的根本区分:频率派视参数为固定常数,概率仅来自数据随机性;贝叶斯派允许对参数赋予概率分布。
两类错误
基于样本信息对总体做推断时,存在两种可能的错误:
- 第一类错误 (Type I Error):弃真—— 本身正确却被拒绝。发生概率即显著性水平 : \[ P(\text{Reject } H_0 \mid H_0 \text{ is true}) = \alpha \]
- 第二类错误 (Type II Error):存伪—— 本身错误却未能被拒绝。发生概率以 表示: \[ P(\text{Fail to Reject } H_0 \mid H_0 \text{ is false}) = \beta \]
研究者通常在控制 的前提下尽可能降低 ,即最大化 统计功效 (Statistical Power, )。零假设的设立为科学方法论提供了客观、可重复的框架,用以评估新发现是否仅源于随机巧合。