知经 KNOWECON · 卓越的经济金融统计数学学习平台

原假设

# 原假设 (Null Hypothesis)

原假设 (Null Hypothesis),在学术文献中通常记为 $H_0$,是{{{推断统计学}}}中{{{假设检验}}} (Hypothesis Testing) 框架的基石。它是一个关于{{{总体参数}}} (Population Parameter) 的陈述,通常代表着“没有效应”、“没有差异”或“维持现状”的立场。在进行一项研究时,研究者通常希望通过收集样本数据来推翻原假设,从而证明他们所提出的理论或发现(即{{{备择假设}}})是成立的。

原假设在科学探究方法中扮演着类似“无罪推定”原则中的“假定无罪”角色。统计检验的目的不是去“证明”原假设是正确的,而是评估我们从{{{样本}}}中收集到的证据,看其是否有足够的力量来拒绝原假设。

## 原假设与备择假设

在任何假设检验中,都存在一对互斥且穷尽的假设:原假设 ($H_0$) 和 备择假设 (Alternative Hypothesis),记为 $H_1$ 或 $H_a$。

* 原假设 ($H_0$):这是一个我们试图用证据来反驳的陈述。它总是包含等号($=$、$≤$ 或 $≥$)。例如,一个新药没有效果,两种教学方法的平均得分相同,或者一个变量与另一个变量不相关。 * $H_0: \mu_1 = \mu_2$ (两个总体的均值相等) * $H_0: \rho = 0$ (两个变量的{{{相关系数}}}为零) * $H_0: p \ge 0.5$ (某项成功的比例不低于50%)

* 备择假设 ($H_1$ 或 $H_a$):这是当有足够证据拒绝原假设时,我们所接受的陈述。它代表着研究者真正想要证明的观点,例如存在一种效应、存在差异或存在某种关系。备择假设永远不包含等号的纯粹形式。 * $H_1: \mu_1 \neq \mu_2$ (两个总体的均值不相等,此为{{{双尾检验}}}) * $H_1: \rho > 0$ (两个变量正相关,此为{{{单尾检验}}}) * $H_1: p < 0.5$ (某项成功的比例低于50%,此为{{{单尾检验}}})

原假设和备择假设是关于未知的 {{{总体参数}}} (如总体均值 $\mu$、总体比例 $p$、总体相关系数 $\rho$)的陈述,而不是关于我们从数据中计算出的 {{{样本统计量}}} (如样本均值 $\bar{x}$、样本比例 $\hat{p}$)的陈述。

## 假设检验的逻辑

假设检验的整个过程围绕着对原假设的评估展开。其核心思想是:我们先假设原假设 ($H_0$) 是真的。然后,我们观察我们收集到的样本数据。最后,我们问自己一个问题:“如果原假设是真的,我们观察到的这个样本结果(或比它更极端的结果)出现的可能性有多大?”

这个可能性就是所谓的 {{{p值}}} (p-value)

* 如果这个p值非常小(通常小于预设的{{{显著性水平}}} $\alpha$,如0.05),这意味着在原假设为真的前提下,我们观察到的样本结果是极不可能发生的。因此,我们有理由怀疑原假设的真实性,并决定 拒绝原假设 ($H_0$)。 * 如果这个p值较大(大于 $\alpha$),这意味着我们观察到的样本结果在原假设为真的情况下是相当可能发生的。因此,我们没有足够的证据来推翻原假设,我们只能 未能拒绝原假设 ($H_0$)。

### 一个类比:法庭审判

* 原假设 ($H_0$):被告无罪。这是法庭开始审判时的默认立场。 * 备择假设 ($H_1$):被告有罪。这是检察官试图证明的。 * 证据:收集到的样本数据。 * 审判过程:统计检验。 * 判决: * 拒绝 $H_0$ (“有罪”):证据足够强大,超出了合理怀疑,可以推翻“无罪”的假设。这在统计学中被称为 {{{统计显著}}} 的结果。 * 未能拒绝 $H_0$ (“无罪”):证据不足以定罪。这并不意味着被告被证明是无辜的,只是说检方未能提供足够的证据来证明其有罪。同样,在统计学中,未能拒绝 $H_0$ 并不意味着 $H_0$ 是正确的,仅仅是我们没有足够的数据证据来反驳它。

## 如何陈述和检验原假设

以下是进行假设检验的标准步骤:

1. 陈述假设:明确写出原假设 ($H_0$) 和备择假设 ($H_1$)。这是最关键的一步,因为它决定了检验的类型(双尾、左尾或右尾)。 * 示例:一位经济学家想检验某地区大学毕业生的平均起薪是否为 60,000 USD。 * $H_0: \mu = 60000$ * $H_1: \mu \neq 60000$

2. 设定显著性水平:选择一个{{{显著性水平}}} $\alpha$。这是一个阈值,代表我们愿意承担的犯{{{第一类错误}}}的风险。常用的 $\alpha$ 值为 0.05, 0.01, 或 0.10。

3. 计算检验统计量:根据样本数据,计算一个{{{检验统计量}}} (Test Statistic),如{{{z统计量}}}、{{{t统计量}}}或{{{卡方统计量}}}。这个值衡量了样本统计量(如样本均值 $\bar{x}$)与原假设中设定的总体参数(如 $\mu_0$)之间的差异程度,并将其标准化。 * 例如,对于均值检验,一个简化的z统计量公式为:$$ z = \frac{\bar{x} - \mu_0}{\sigma / \sqrt{n}} $$ 其中 $\bar{x}$ 是样本均值,$\mu_0$ 是原假设中的总体均值,$\sigma$ 是总体标准差, $n$ 是样本量。

4. 做出统计决策:通过比较检验统计量和{{{临界值}}} (Critical Value),或者比较p值和 $\alpha$,来做出决策。 * p值法:如果 $p \text{-value} \le \alpha$,则拒绝 $H_0$。 * 临界值法:如果检验统计量落在了{{{拒绝域}}} (Rejection Region) 内(即比临界值更极端),则拒绝 $H_0$。

5. 解释结果:用通俗易懂的语言,在问题的背景下解释统计决策的含义。明确指出是否有足够的证据支持备择假设。

## 假设检验中的两类错误

在对原假设做出决策时,我们可能会犯两种错误:

* {{{第一类错误}}} (Type I Error):当原假设 ($H_0$) 实际上为真时,我们却错误地拒绝了它。这种“弃真”的错误发生的概率就是我们设定的显著性水平 $\alpha$。 * {{{第二类错误}}} (Type II Error):当原假设 ($H_0$) 实际上为假时,我们却未能拒绝它。这种“取伪”的错误发生的概率用 $\beta$ 表示。而 $(1-\beta)$ 被称为检验的 {{{统计功效}}} (Power of a Test),即正确拒绝一个错误的$H_0$的概率。

在实践中,降低一种错误的概率通常会增加另一种错误发生的概率。选择合适的 $\alpha$ 水平是在这两种风险之间进行权衡。

## 实例应用

场景:一家制药公司开发了一种新的降压药,并希望证明它比安慰剂更有效。研究人员随机抽取100名高血压患者,50人服用新药,50人服用{{{安慰剂}}}。

* 原假设 ($H_0$):新药的效果与安慰剂相同。即两组患者的平均血压下降值没有差异 ($\mu_{drug} - \mu_{placebo} = 0$)。 * 备择假设 ($H_1$):新药的效果优于安慰剂。即服用新药组的平均血压下降值大于服用安慰剂组 ($\mu_{drug} - \mu_{placebo} > 0$)。 * 过程:研究人员收集数据,计算两组的样本平均血压下降值和标准差,然后计算出一个{{{t统计量}}}。假设他们得到的p值为 0.02。 * 决策:如果他们设定的 $\alpha = 0.05$,因为 $p \text{-value} (0.02) < \alpha (0.05)$,他们将拒绝原假设。 * 结论:研究人员可以得出结论,有充分的统计证据表明,该新药在降低血压方面比安慰剂更有效。