# 拒绝域 (Rejection Region)
拒绝域 (Rejection Region),也被称为 临界域 (Critical Region),是{{{统计学}}}中{{{假设检验}}} (Hypothesis Testing) 框架下的一个核心概念。它指的是一个由{{{检验统计量}}} (Test Statistic) 的所有可能值组成的集合。当一次抽样计算出的检验统计量的值落入这个集合中时,我们便会做出拒绝{{{原假设}}} ($H_0$) 的决策。
简单来说,拒绝域是在进行假设检验之前预先设定的一个“拒绝标准”区域。如果我们的样本证据(体现为检验统计量)足够极端,以至于其数值进入了这个区域,我们就认为这个证据强烈地反对原假设,因此拒绝它。
## 拒绝域在假设检验中的作用
假设检验的过程可以被视为在“原假设为真”和“备择假设为真”这两种可能性之间做出选择。拒绝域是这个决策过程中的关键工具,其构建和使用遵循以下逻辑:
1. 建立假设:首先,我们需要陈述{{{原假设}}} ($H_0$) 和{{{备择假设}}} ($H_1$ 或 $H_a$)。原假设通常代表一种基准状态或无效果状态,而备择假设是我们希望寻找证据来支持的论点。 2. 选择检验统计量:根据数据的类型和检验的目的,我们选择一个合适的检验统计量(例如 {{{Z统计量}}}、{{{t统计量}}}、{{{卡方统计量}}}等)。这个统计量是一个从样本数据中计算出的数值,它衡量了样本数据与原假设之间的偏离程度。 3. 确定显著性水平并构建拒绝域:在收集数据之前,研究者需要设定一个 {{{显著性水平}}} (Significance Level),通常用希腊字母 $\alpha$ 表示。$\alpha$ 代表了我们愿意承担的犯 {{{第一类错误}}} (Type I Error) 的最大概率。第一类错误指的是当原假设实际上为真时,我们却错误地拒绝了它。拒绝域的大小完全由 $\alpha$ 决定。 4. 做出决策:计算出检验统计量的具体值后,我们将其与预设的拒绝域进行比较。 * 如果检验统计量的值 落在 拒绝域内,我们拒绝原假设 $H_0$。 * 如果检验统计量的值 没有落在 拒绝域内,我们称“未能拒绝”(fail to reject) 原假设 $H_0$ 。
## 如何确定拒绝域
拒绝域的确定依赖于三个关键因素:检验统计量的{{{抽样分布}}} (Sampling Distribution)、显著性水平 $\alpha$ 以及备择假设 $H_1$ 的形式。
{{{临界值}}} (Critical Value) 是定义拒绝域边界的点。它是一个或多个阈值,将检验统计量的所有可能值划分为“拒绝域”和“接受域”(更准确地说是“非拒绝域”)。
根据备择假设 $H_1$ 的不同,检验可以是双尾的、左尾的或右尾的,这直接决定了拒绝域的位置。
### 1. 双尾检验 (Two-Tailed Test)
当备择假设的形式为不等于($\neq$)时,我们进行双尾检验。例如: * $H_0: \mu = \mu_0$ * $H_1: \mu \neq \mu_0$
在这种情况下,极端的结果可能出现在分布的两个方向(过大或过小)。因此,拒绝域被分成两部分,分别位于抽样分布的两个尾部。总的错误概率 $\alpha$ 被平均分配到两边,每边的面积为 $\alpha/2$。
例如,在一个使用{{{正态分布}}}(Z检验)的检验中,如果设定 $\alpha = 0.05$,则每边的面积为 $0.025$。对应的临界值是 $Z_{\alpha/2}$ 和 $-Z_{\alpha/2}$。查阅标准正态分布表可知,临界值为 $1.96$ 和 $-1.96$。 * 拒绝域:所有满足 $Z < -1.96$ 或 $Z > 1.96$ 的检验统计量值。
### 2. 右尾检验 (Right-Tailed Test)
当备择假设的形式为大于($>$)时,我们进行右尾检验。例如: * $H_0: \mu \le \mu_0$ * $H_1: \mu > \mu_0$
在这种情况下,我们只关心样本结果是否显著“大于”原假设的值。因此,整个拒绝域都位于抽样分布的右侧(上侧)尾部。这块区域的面积等于显著性水平 $\alpha$。
例如,在一个Z检验中,如果设定 $\alpha = 0.05$,我们需要找到一个临界值 $Z_{\alpha}$,使得其右侧的面积为 $0.05$。查阅标准正态分布表可知,该临界值为 $1.645$。 * 拒绝域:所有满足 $Z > 1.645$ 的检验统计量值。
### 3. 左尾检验 (Left-Tailed Test)
当备择假设的形式为小于($<$)时,我们进行左尾检验。例如: * $H_0: \mu \ge \mu_0$ * $H_1: \mu < \mu_0$
与右尾检验相反,我们只关心样本结果是否显著“小于”原假设的值。因此,整个拒绝域都位于抽样分布的左侧(下侧)尾部,面积同样为 $\alpha$。
例如,在一个Z检验中,如果设定 $\alpha = 0.05$,临界值 $-Z_{\alpha}$ 左侧的面积为 $0.05$。根据对称性,该临界值为 $-1.645$。 * 拒绝域:所有满足 $Z < -1.645$ 的检验统计量值。
## 一个具体的例子
假设一家灯泡制造商声称其生产的灯泡平均寿命为 800 小时。我们怀疑这个说法不实(可能过高或过低),于是随机抽取了 100 个灯泡进行测试,得到样本平均寿命为 788 小时。已知灯泡寿命服从正态分布,且总体标准差 $\sigma = 40$ 小时。我们设定显著性水平 $\alpha = 0.05$。
1. 建立假设: * $H_0: \mu = 800$ (平均寿命是800小时) * $H_1: \mu \neq 800$ (平均寿命不是800小时)
2. 选择检验统计量:由于总体标准差已知,样本量较大($n=100$),我们使用Z检验。检验统计量的计算公式为: $$ Z = \frac{\bar{X} - \mu_0}{\sigma / \sqrt{n}} $$ 其中 $\bar{X}$ 是样本均值,$\mu_0$ 是假设的总体均值,$\sigma$ 是总体标准差, $n$ 是样本量。
3. 确定拒绝域: * 这是一个双尾检验。 * 显著性水平 $\alpha = 0.05$。 * 临界值是 $\pm Z_{\alpha/2} = \pm Z_{0.025} = \pm 1.96$。 * 因此,拒绝域是 $\{Z \mid Z < -1.96 \text{ 或 } Z > 1.96\}$。
4. 计算检验统计量: $$ Z_{computed} = \frac{788 - 800}{40 / \sqrt{100}} = \frac{-12}{40 / 10} = \frac{-12}{4} = -3.0 $$
5. 做出决策: 计算出的检验统计量 $Z = -3.0$。因为 $-3.0 < -1.96$,所以该值落在了拒绝域内。
6. 结论:在 $5\%$ 的显著性水平上,我们有充分的证据拒绝原假设。结论是,该批灯泡的平均寿命显著不等于 800 小时。
## 拒绝域与p值的关系
拒绝域方法是假设检验的两种主要方法之一,另一种是 {{{p值}}} (p-value) 方法。两者在本质上是等价的,并且总会得出相同的结论。
* 拒绝域方法:比较“统计量”和“临界值”。如果 检验统计量 > 临界值 (对于右尾检验) 或 |检验统计量| > |临界值| (对于双尾检验),则拒绝 $H_0$。 * p值方法:比较“概率”和“显著性水平”。如果 p值 $\le \alpha$,则拒绝 $H_0$。
这两种方法的关系是:当一个检验统计量的值落入拒绝域时,其对应的p值必然小于或等于显著性水平 $\alpha$。在上面的例子中,Z值为-3.0对应的双尾p值约为 $0.0027$。因为 $0.0027 < 0.05$,所以我们同样会拒绝原假设。