ARTICLE
原假设
原假设 (Null Hypothesis) 原假设 (Null Hypothesis),在学术文献中通常记为 H_0,是 推断统计学 中 假设检验 (Hypothesis Testing) 框架的基石。它是一个关于 总体参数 (Population Parameter) 的陈述,通常代表着"没有效应"、"没有差异"或"维持现状"的立场。研究者通常希望通过收集
原假设 (Null Hypothesis)
原假设 (Null Hypothesis),在学术文献中通常记为 ,是 推断统计学 中 假设检验 (Hypothesis Testing) 框架的基石。它是一个关于 总体参数 (Population Parameter) 的陈述,通常代表着"没有效应"、"没有差异"或"维持现状"的立场。研究者通常希望通过收集 样本 数据来推翻原假设,从而证明他们所提出的理论(即 备择假设)成立。
原假设在科学探究中扮演着类似"无罪推定"中"假定无罪"的角色。统计检验的目的不是去"证明"原假设正确,而是评估样本证据是否有足够力量来拒绝原假设。
原假设与备择假设
在任何假设检验中,都存在一对互斥且穷尽的假设:原假设 和 备择假设 (Alternative Hypothesis) 或 。
原假设是试图用证据反驳的陈述,总是包含等号(、 或 )。例如:新药没有效果、两种教学方法的平均得分相同、一个变量与另一个变量不相关。
备择假设是当有足够证据拒绝原假设时所接受的陈述,代表研究者真正想证明的观点。备择假设永远不包含等号的纯粹形式。
关键区分:原假设和备择假设是关于未知 总体参数(如 、、)的陈述,而非关于 样本统计量(如 、)的陈述。
假设检验的逻辑
假设检验的核心思路:先假定 为真,然后观察样本数据,问:"如果 为真,观察到这个样本结果(或更极端的)的概率有多大?"
这个概率即 p值 (p-value):
- 若 p 值很小(通常小于预设的 显著性水平 ,如 0.05),意味着在 为真时该结果是极不可能的,因此 拒绝原假设。
- 若 p 值较大(大于 ),则没有足够证据推翻原假设,只能 未能拒绝原假设。
法庭类比:原假设为"被告无罪",备择假设为"被告有罪"。拒绝 ("有罪")需要证据超出合理怀疑,这对应统计上 统计显著 的结果;未能拒绝 ("无罪")不意味着被告被证明无辜,仅表示证据不足。同样,未能拒绝 不意味 正确,仅表示数据证据不足以反驳它。
检验步骤
- 陈述假设:明确写出 和 ,这决定了检验类型(双尾检验、左尾或右尾)。例如检验某地区大学毕业生平均起薪是否为 60,000 USD:,。
- 设定显著性水平:选择 (通常 0.05、0.01 或 0.10),代表愿意承担的 第一类错误 风险。
- 计算检验统计量:根据样本数据计算 检验统计量(如 z统计量、t统计量 或 卡方统计量),衡量样本统计量与 设定参数之间的标准化差异。对于均值检验: \[ z = \frac{\bar{x} - \mu_0}{\sigma / \sqrt{n}} \] 其中 为样本均值, 为原假设总体均值, 为总体标准差, 为样本量。
- 做出统计决策:比较 p 值与 (若 则拒绝 ),或比较检验统计量与 临界值(若落入 拒绝域 则拒绝 )。
- 解释结果:在问题背景下用通俗语言解释统计决策,明确是否有足够证据支持备择假设。
两类错误
- 第一类错误 (Type I Error): 为真却错误拒绝("弃真"),发生概率为 。
- 第二类错误 (Type II Error): 为假却未能拒绝("取伪"),发生概率为 。 称为 统计功效,即正确拒绝错误 的概率。
降低一种错误的概率通常会增加另一种错误的风险,选择 是在两者之间权衡。
实例应用
一家制药公司开发新降压药,欲证明其比 安慰剂 更有效。随机抽取 100 名患者,50 人服药,50 人服安慰剂。
- :新药与安慰剂效果相同 ()。
- :新药优于安慰剂 ()。
研究人员收集两组血压下降数据,计算 t统计量,得 p 值为 0.02。设定 ,因 ,拒绝 。结论:有充分的统计证据表明新药比安慰剂更有效。