ARTICLE

Z-检验

Z-检验 (Z-Test) Z-检验，也称为正态检验或标准分数检验，是统计假设检验中最基本的参数检验方法之一。其名称来源于检验统计量所服从的标准正态分布（ Z N(0,1) ）。Z-检验广泛应用于比较样本统计量与已知总体参数之间是否存在显著差异，是推断统计学的基石。核心思想与适用条件 Z-检验的本质逻辑是：在零假设（ H_0 ）成立的假定下，将观测到的样本

浏览 5 更新 2025-10-26

Z-检验 (Z-Test)

Z-检验，也称为正态检验或标准分数检验，是统计假设检验中最基本的参数检验方法之一。其名称来源于检验统计量所服从的标准正态分布（ $Z \sim N(0,1)$ ）。Z-检验广泛应用于比较样本统计量与已知总体参数之间是否存在显著差异，是推断统计学的基石。

核心思想与适用条件

Z-检验的本质逻辑是：在零假设（ $H_0$ ）成立的假定下，将观测到的样本统计量与假设的总体参数之间的差异，除以该差异的标准误（Standard Error），从而得到一个标准化的距离度量——即 $Z$ 统计量。若该距离过大（落入拒绝域），则表明观察到的差异不太可能仅由随机抽样误差引起，从而拒绝零假设。

Z-检验的使用依赖于以下关键前提：

总体方差已知：这是Z-检验区别于t-检验的最核心条件。 $\sigma^2$ 必须来自历史数据、理论推导或大规模先验研究。
正态性假设：若样本量较小（ $n < 30$ ），要求总体服从正态分布；若样本量较大（ $n \geq 30$ ），依据中心极限定理（Central Limit Theorem），样本均值的抽样分布近似正态，条件可放宽。
独立性：各观测值之间相互独立，通常通过随机抽样保证。
测量尺度：数据至少为定距尺度（Interval Scale）。

常见类型与检验统计量

根据研究设计和比较对象的不同，Z-检验可分为以下几种主要形式：

单样本 Z-检验 (One-Sample Z-Test)

用于检验单一样本的均值是否与已知的总体均值 $\mu_0$ 有显著差异。检验统计量为：

Z = \frac{\bar{X} - \mu_0}{\sigma / \sqrt{n}}

其中 $\bar{X}$ 为样本均值， $\mu_0$ 为假设的总体均值， $\sigma$ 为已知的总体标准差， $n$ 为样本量。

双样本 Z-检验 (Two-Sample Z-Test)

用于比较两个独立样本的均值是否存在显著差异，且两个总体的方差 $\sigma_1^2$ 和 $\sigma_2^2$ 均已知：

Z = \frac{(\bar{X}_1 - \bar{X}_2) - (\mu_1 - \mu_2)_0}{\sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}}

其中 $(\mu_1 - \mu_2)_0$ 通常为零（检验两均值是否相等）。

单样本比例 Z-检验 (One-Proportion Z-Test)

用于检验二项分布中的总体比例 $p$ 是否等于某个假设值 $p_0$ ：

Z = \frac{\hat{p} - p_0}{\sqrt{\frac{p_0(1 - p_0)}{n}}}

其中 $\hat{p}$ 为样本比例。该方法要求 $n p_0 \geq 5$ 且 $n(1 - p_0) \geq 5$ ，以保证正态近似的合理性。

双样本比例 Z-检验 (Two-Proportion Z-Test)

用于比较两个独立总体的比例是否有显著差异：

Z = \frac{(\hat{p}_1 - \hat{p}_2) - 0}{\sqrt{\hat{p}(1 - \hat{p})\left(\frac{1}{n_1} + \frac{1}{n_2}\right)}}

其中 $\hat{p}$ 为两组合并后的样本比例： $\hat{p} = \frac{x_1 + x_2}{n_1 + n_2}$ 。

假设检验的执行步骤

一次完整的Z-检验通常遵循标准化流程：

建立假设：设定零假设 $H_0: \mu = \mu_0$ （或 $\mu_1 = \mu_2$ ）以及相应的备择假设 $H_1$ ，备择假设可以是双侧（ $\mu \neq \mu_0$ ）、左侧（ $\mu < \mu_0$ ）或右侧（ $\mu > \mu_0$ ）。
确定显著性水平：选定 $\alpha$ （通常为 $0.05$ 或 $0.01$ ），即第一类错误（I型错误）的可接受上限。
计算检验统计量：代入公式计算 $Z$ 值。
确定拒绝域或计算 p 值：利用标准正态分布表或统计软件。对于双侧检验，临界值为 $\pm Z_{\alpha/2}$ ；对于单侧检验，临界值为 $Z_{\alpha}$ 或 $-Z_{\alpha}$ 。p值（p-value）表示在 $H_0$ 为真时观测到当前结果或更极端结果的概率。
做出决策：若 $|Z|$ 超过临界值，或 $p \leq \alpha$ ，则拒绝零假设；否则不拒绝零假设。

数值示例

考虑一个实际场景：某工厂生产的灯泡标称平均寿命为 $1200$ 小时。质量工程师从生产线随机抽取 $n = 100$ 个灯泡进行检测，得到样本均值 $\bar{X} = 1185$ 小时。根据历史生产数据，灯泡寿命的总体标准差已知为 $\sigma = 60$ 小时。工程师希望在显著性水平 $\alpha = 0.05$ 下检验灯泡的平均寿命是否显著低于标称值。

这是典型的左侧单样本Z-检验：

$H_0: \mu = 1200$ （平均寿命等于标称值）
$H_1: \mu < 1200$ （平均寿命低于标称值）

代入公式：

Z = \frac{1185 - 1200}{60 / \sqrt{100}} = \frac{-15}{6} = -2.50

对于左侧检验， $\alpha = 0.05$ 对应的临界值为 $-Z_{0.05} = -1.645$ 。由于 $-2.50 < -1.645$ ， $Z$ 值落入拒绝域。同时， $P(Z < -2.50) = 0.0062$ ，即 $p = 0.0062 < 0.05$ 。因此工程师拒绝零假设，认为该批次灯泡的平均寿命显著低于标称值。这一结论意味着观察到的 $15$ 小时偏差不太可能仅因抽样误差导致，提示生产线可能存在系统性问题。

Z-检验与置信区间

Z-检验与置信区间估计在逻辑上高度统一。在显著性水平 $\alpha$ 下，总体均值 $\mu$ 的 $(1 - \alpha)\times 100\%$ 置信区间为：

\bar{X} \pm Z_{\alpha/2} \cdot \frac{\sigma}{\sqrt{n}}

若零假设所指定的参数值落在该置信区间之外，则双侧Z-检验将在同一显著性水平下拒绝 $H_0$ 。这一对偶关系提供了超越单纯的"拒绝/不拒绝"二分决策的丰富信息：置信区间的宽度反映了估计精度，区间与参数假设值的相对位置则揭示了效应的方向与大小。在上文的灯泡示例中， $\mu$ 的 $95\%$ 置信区间为 $1185 \pm 1.96 \times 6$ ，即 $[1173.24, 1196.76]$ ，不包含 $1200$ ，与检验结论一致。

Z-检验与 t-检验的关系

在统计实践中，Z-检验与t-检验的使用经常引起混淆。两者的核心区别在于：

Z-检验要求总体方差 $\sigma^2$ 已知，检验统计量精确服从 $N(0,1)$ 。
t-检验适用于总体方差未知的情形，用样本方差 $s^2$ 替代 $\sigma^2$ ，检验统计量服从自由度为 $n-1$ 的t分布。

当样本量趋于无穷大时，t分布收敛于标准正态分布。因此，在大样本（ $n \to \infty$ ）下，即使总体方差未知，Z-检验与t-检验的结果也渐近一致。然而，在小样本且方差未知时，t-检验是严格正确的选择，Z-检验会导致第一类错误率膨胀。

应用与评价

Z-检验在质量控制（如 $\bar{X}$ -控制图）、医药统计（如非劣效性检验）、市场研究（如广告转化率比较）以及社会科学（如民意调查差异分析）中均有广泛使用。其主要优势在于数学形式简洁、理论基础坚实且便于计算。局限则在于"总体方差已知"这一条件在实际工作中很少满足，使得t-检验在多数应用场景中更为常用。理解Z-检验不仅有助于掌握推断统计的基本逻辑，也是深入学习统计功效分析与效应量概念的重要起点。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。