ARTICLE

假设检验

假设检验 (Hypothesis Testing) 假设检验 (Hypothesis Testing)，也称显著性检验 (Significance Testing)，是推断统计学的核心工具。它是一种基于样本数据判断关于总体参数的断言是否成立的统计方法。其本质是"证伪"：先提出一个需要被检验的假设（零假设），再评估样本证据反对该假设的强度。核心概念零假设

浏览 76 更新 2025-10-22

假设检验 (Hypothesis Testing)

假设检验 (Hypothesis Testing)，也称 显著性检验 (Significance Testing)，是推断统计学的核心工具。它是一种基于样本数据判断关于总体参数的断言是否成立的统计方法。其本质是"证伪"：先提出一个需要被检验的假设（零假设），再评估样本证据反对该假设的强度。

核心概念

零假设 ( $H_0$ )：研究者想要推翻的陈述，代表"无效应"或"无差异"。检验中我们假定 $H_0$ 为真，再寻找反对证据。

备择假设 ( $H_1$ 或 $H_a$ )： $H_0$ 的对立面。其形式决定检验类型：

双边检验： $H_1$ 为"不等于"（ $≠$ ），检验任一方向的偏离。
单边检验： $H_1$ 为"大于"（ $>$ ）或"小于"（ $<$ ），检验特定方向的偏离。

逻辑框架

假设检验遵循"无罪推定"逻辑：先假定 $H_0$ 为真（嫌疑人无罪），收集样本数据（证据）。若证据足够强，拒绝 $H_0$ ；若证据不足，未能拒绝 $H_0$ 。注意：未能拒绝 $H_0$ 不等于证明 $H_0$ 正确——仅表明证据不足以推翻它。

两类错误

Type I Error（弃真）： $H_0$ 为真却被拒绝，概率记为 $\alpha$ （显著性水平）。
Type II Error（取伪）： $H_0$ 为假却未拒绝，概率记为 $\beta$ 。

$\alpha$ 通常设为 0.05、0.01 或 0.10。减小 $\alpha$ 降低第一类错误风险，但会增加 $\beta$ 。 $1-\beta$ 称为统计功效。

实施步骤

步骤 1：陈述假设。明确 $H_0$ 和 $H_1$ ，决定检验方向。

步骤 2：设定 $\alpha$ 。选择可容忍的第一类错误概率上限。

步骤 3：计算检验统计量。常见统计量：

$z$ 统计量：大样本或总体方差已知。
$t$ 统计量：小样本且总体方差未知，基于t分布。
$\chi^2$ 统计量：分类数据的拟合优度或独立性检验。
$F$ 统计量：方差分析 (ANOVA) 或回归整体显著性。

步骤 4：做出决策。两种等价方法：

临界值法：据 $\alpha$ 和分布确定临界值与拒绝域。检验统计量落入拒绝域则拒绝 $H_0$ 。

P值法（更常用）：计算P值——假定 $H_0$ 为真时，观察到当前或更极端结果的概率。若 $p\text{-value} \leq \alpha$ ，拒绝 $H_0$ ；否则未能拒绝。P值越小，反对 $H_0$ 的证据越强。

示例：单样本 Z 检验

灯泡厂声称产品平均寿命 $\mu=800$ 小时。抽检 $n=36$ 个灯泡， $\bar{x}=815$ ，已知 $\sigma=40$ 。 $\alpha=0.05$ ，双边检验。

$H_0: \mu=800$ ， $H_1: \mu \neq 800$ 。

z = \frac{\bar{x} - \mu_0}{\sigma / \sqrt{n}} = \frac{815-800}{40/6} = 2.25

$\alpha=0.05$ 双边临界值 $z_{\alpha/2}=\pm 1.96$ 。 $z=2.25 > 1.96$ ，落入拒绝域。

$p = 2 \times P(Z \geq 2.25) \approx 0.0244 < 0.05$ 。

结论：拒绝 $H_0$ ，平均寿命与 800 小时有显著差异。

统计显著 vs 实际显著

统计显著性不等同于实际显著性。大样本下，微小差异（如 $\bar{x}=800.1$ ）也可能统计显著但毫无实际意义。应结合效应量 (Effect Size) 评估差异幅度。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。