ARTICLE
零假设 ($H_0$)
零假设 (Null Hypothesis, H_0) 零假设 (Null Hypothesis),通常记作 H_0,是 统计假设检验 中处于核心地位的一个命题,指被设定为"默认成立"或"无效应、无差异"的状态,检验的目的就是用样本数据去判断是否有足够证据推翻它。零假设通常代表一种保守的、维持现状的立场,例如"新药无效""两组均值相等""回归系数为零"等。检验
零假设 (Null Hypothesis, )
零假设 (Null Hypothesis),通常记作 ,是 统计假设检验 中处于核心地位的一个命题,指被设定为"默认成立"或"无效应、无差异"的状态,检验的目的就是用样本数据去判断是否有足够证据推翻它。零假设通常代表一种保守的、维持现状的立场,例如"新药无效""两组均值相等""回归系数为零"等。检验的逻辑不是直接证明 备择假设 成立,而是通过控制犯错概率来评估零假设的可信程度:只有在数据与零假设严重不一致时,才拒绝 转而接受备择假设。
零假设在假设检验中的角色
假设检验的推理框架建立在"反证法"思想之上。研究者真正感兴趣的命题通常放在 备择假设 (Alternative Hypothesis, ) 中,而零假设则是该命题的"反面"。检验从假定 为真出发,考察在当前样本下观察到极端结果的概率即 p值 (p-value)。若 值小于预先设定的 显著性水平 (Significance Level, ),则认为数据提供了足够强的反证,拒绝 ;否则不能拒绝 。
需要强调的是,"不能拒绝 "并不等同于"接受 为真"。它仅意味着当前数据没有提供足够的证据去推翻零假设,可能因为样本量不足、效应确实为零,也可能因为数据噪声过大。这一逻辑不对称性是假设检验中最容易被误解的地方。
零假设的设定原则
零假设的设定遵循几条基本规则。其一, 必须包含等号。例如 或 都是合法的零假设,而 (严格不等式)不能直接作为零假设,因为等号是计算检验统计量在零假设下分布的必要条件。其二,零假设通常体现"无差异"或"无效"的保守立场。在 两样本均值差异的检验 中,零假设一般为 ;在回归分析中,对单个系数的检验通常设 。
其三,零假设应该在收集数据之前确定。如果看到数据之后再设定 ,检验的统计性质(如 第一类错误 概率)将不再有效,这属于 p值操纵 (p-hacking) 的一种形式。
两类错误与零假设
零假设检验框架下存在两种可能的决策错误。第一类错误 (Type I Error) 是指 实际为真却被拒绝,其概率由显著性水平 控制,通常设为 0.05 或 0.01。第二类错误 (Type II Error) 是指 为假却未能拒绝,其概率记为 ,而 称为检验的 功效 (Power)。
两种错误之间存在权衡:降低 (使拒绝标准更严格)会减少第一类错误但增加第二类错误概率(在其他条件不变时)。样本量是同时降低两类错误的主要手段,这也是 样本量计算 (Sample Size Calculation) 在实验设计中的核心作用。
经济学中的应用实例
在 计量经济学 中,零假设几乎无处不在。检验某个政策是否有效时,设 ,即政策效应为零。在 有效市场假说 的检验中,零假设为"市场是有效的",研究者需要找到足够强的证据才能宣称市场无效。在 格兰杰因果检验 中,零假设为"X 不格兰杰导致 Y",即过去的 X 无助于预测 Y。这些例子共同体现了零假设的保守本质:将需要强证据支撑的命题放在对立面,用数据去尝试推翻一个"无趣"但可靠的原假设。