ARTICLE

z检验

Z检验 (Z-test) Z检验 (Z-test) 是一种在统计学中广泛应用的假设检验方法。它的核心用途是判断一个或多个大样本的均值与总体均值之间是否存在显著差异,或者比较两个大样本的均值是否存在显著差异。Z检验的基础是正态分布理论,其关键前提是总体的方差(或标准差)已知。 当满足特定条件时,Z检验通过计算一个称为 Z统计量 (Z-statistic) 或

浏览 51 更新 2025-10-26

Z检验 (Z-test)

Z检验 (Z-test) 是一种在统计学中广泛应用的假设检验方法。它的核心用途是判断一个或多个大样本的均值与总体均值之间是否存在显著差异,或者比较两个大样本的均值是否存在显著差异。Z检验的基础是正态分布理论,其关键前提是总体的方差(或标准差)已知。

当满足特定条件时,Z检验通过计算一个称为 Z统计量 (Z-statistic)Z分数 (Z-score) 的值,来评估样本数据零假设H0 H_0 )之间的相符程度。这个Z统计量衡量了样本均值与假设的总体均值之间相差了多少个标准误

Z检验的理论基础与前提条件

Z检验的有效性建立在几个关键的假设之上,学习者必须在应用前仔细核对:

  1. 总体方差已知:这是Z检验最核心且最严格的条件。我们必须知道所研究的总体的方差 σ2 {\sigma}^2 或标准差 σ \sigma 。在现实世界的应用中,这个条件通常难以满足,因为我们往往对总体知之甚少。但在某些领域,如工业生产质量控制中,由于长期的生产实践,总体的某些参数可能是已知的。
  1. 正态分布:数据必须来源于一个服从正态分布的总体。然而,根据强大的中心极限定理 (Central Limit Theorem, CLT),即使原始总体不是正态分布,只要样本量足够大(通常认为 n30 n \ge 30 ),样本均值的抽样分布也会近似于正态分布。因此,对于大样本,此条件可以放宽。
  1. 样本独立性:样本中的每个观测值都应是相互独立的。这意味着一个观测值的出现不会影响另一个观测值。通常通过随机抽样来保证。
  1. 随机抽样:样本必须是从总体中随机抽取的,以确保样本能够代表总体。

Z检验的统计量

Z检验的核心是计算Z统计量,对于单样本Z检验(One-sample Z-test),其公式为:

Z=xˉμ0σ/nZ = \frac{\bar{x} - \mu_0}{\sigma / \sqrt{n}}

其中:

  • xˉ \bar{x} 样本均值 (sample mean),是对总体均值 μ \mu 点估计
  • μ0 \mu_0 是在零假设 H0 H_0 中我们设定的总体均值。
  • σ \sigma 是已知的总体标准差 (population standard deviation)。
  • n n 是样本量 (sample size)。
  • 分母 σ/n \sigma / \sqrt{n} 被称为均值的标准误 (standard error of the mean),它度量了样本均值 xˉ \bar{x} 的抽样变异性。

这个公式的直观解释是:我们观察到的样本均值 (xˉ \bar{x} ) 与我们假设的总体均值 (μ0 \mu_0 ) 之间的差异,是以“标准误”为单位来衡量的。一个Z值如果是2,就意味着样本均值比假设的总体均值高出2个标准误的单位。

Z检验的实施步骤

进行一次完整的Z检验通常遵循以下五个步骤,这是一个规范化的统计推断流程。

第一步:陈述假设

  • 零假设 (H0 H_0 ):也称原假设,它通常陈述一种“无差异”或“无效果”的情况。在Z检验中,它通常写作 H0:μ=μ0 H_0: \mu = \mu_0
  • 备择假设 (Ha H_a H1 H_1 ):是研究者希望证明的假设,它与零假设对立。备择假设有三种形式:
  1. 双尾检验 (Two-tailed test)Ha:μμ0 H_a: \mu \neq \mu_0 。我们关心均值是否与 μ0 \mu_0 “不同”,不指定方向。
  2. 右尾检验 (Right-tailed test)Ha:μ>μ0 H_a: \mu > \mu_0 。我们关心均值是否“大于”μ0 \mu_0
  3. 左尾检验 (Left-tailed test)Ha:μ<μ0 H_a: \mu < \mu_0 。我们关心均值是否“小于”μ0 \mu_0

第二步:设定显著性水平

显著性水平 (α \alpha ) 是在假设 H0 H_0 为真的情况下,我们愿意承担的错误地拒绝 H0 H_0 的最大概率。这个错误被称为第一类错误 (Type I error)。通用的 α \alpha 值包括 0.05, 0.01, 和 0.10。

第三步:计算Z统计量

使用前面提到的Z统计量公式 Z=(xˉμ0)/(σ/n) Z = (\bar{x} - \mu_0) / (\sigma / \sqrt{n}) 计算出Z值。

第四步:确定决策规则

有两种主流的方法来做出统计决策:

  • 临界值法 (Critical Value Approach)
  1. 根据显著性水平 α \alpha 和备择假设的类型,在标准正态分布(Z分布)上找到一个或两个临界值 (critical value),这些值构成了拒绝域 (rejection region) 的边界。
  • 双尾检验:临界值为 ±Zα/2 \pm Z_{\alpha/2}
  • 右尾检验:临界值为 Zα Z_{\alpha}
  • 左尾检验:临界值为 Zα -Z_{\alpha}
  1. 决策规则:如果计算出的Z统计量落入拒绝域(例如,对于右尾检验,如果 Z>Zα Z > Z_{\alpha} ),则拒绝零假设 H0 H_0
  • P值法 (P-value Approach)
  1. 计算p-value。p值是在假定零假设为真的情况下,观测到当前样本结果或更极端结果的概率。
  • 双尾检验:p=2×P(Z>Zcalc) p = 2 \times P(Z > |Z_{calc}|) ,其中 Zcalc Z_{calc} 是计算出的Z统计量。
  • 右尾检验:p=P(Z>Zcalc) p = P(Z > Z_{calc})
  • 左尾检验:p=P(Z<Zcalc) p = P(Z < Z_{calc})
  1. 决策规则:如果 pα p \le \alpha ,则拒绝零假设 H0 H_0 。p值法在现代统计软件中更为常用,因为它提供了更多关于证据强度的信息。

第五步:得出结论

根据第四步的决策(拒绝或未能拒绝 H0 H_0 ),结合问题的背景进行解释。例如,如果拒绝了 H0 H_0 ,我们可以说“有足够的统计证据表明,总体均值不等于 μ0 \mu_0 ”。注意,我们从不“接受”零假设,而是“未能拒绝”它,这反映了我们无法证明一个假设为真的统计逻辑。

应用示例

假设一家灯泡制造商声称其生产的节能灯泡平均寿命为8000小时,且寿命分布的标准差 σ \sigma 为400小时。一个消费者权益组织随机抽取了36个灯泡进行测试,测得样本平均寿命 xˉ \bar{x} 为7880小时。在 α=0.05 \alpha = 0.05 的显著性水平下,我们是否有足够证据质疑制造商的声明?

  1. 陈述假设
  • H0:μ=8000 H_0: \mu = 8000 (制造商的声明是真的)
  • Ha:μ8000 H_a: \mu \neq 8000 (制造商的声明是假的,我们关心任何方向的差异,故使用双尾检验)
  1. 设定显著性水平
  • α=0.05 \alpha = 0.05
  1. 计算Z统计量
  • xˉ=7880 \bar{x} = 7880 , μ0=8000 \mu_0 = 8000 , σ=400 \sigma = 400 , n=36 n = 36
Z=78808000400/36=120400/6=12066.671.80 Z = \frac{7880 - 8000}{400 / \sqrt{36}} = \frac{-120}{400 / 6} = \frac{-120}{66.67} \approx -1.80
  1. 确定决策规则
  • 临界值法:对于双尾检验和 α=0.05 \alpha = 0.05 ,拒绝域由 α/2=0.025 \alpha/2 = 0.025 决定。查标准正态分布表可知,临界值为 ±Z0.025=±1.96 \pm Z_{0.025} = \pm 1.96 。我们的决策规则是:如果 Z>1.96 |Z| > 1.96 ,则拒绝 H0 H_0

计算出的Z值为-1.80。因为 1.80=1.80 |-1.80| = 1.80 ,而 1.80<1.96 1.80 < 1.96 ,所以Z值没有落入拒绝域。

  • P值法:我们需要计算 p=P(Z<1.80 or Z>1.80)=2×P(Z>1.80) p = P(Z < -1.80 \text{ or } Z > 1.80) = 2 \times P(Z > 1.80) 。查标准正态分布表或使用软件,可得 P(Z>1.80)0.0359 P(Z > 1.80) \approx 0.0359 。因此,p2×0.0359=0.0718 p \approx 2 \times 0.0359 = 0.0718

我们的决策规则是:如果 pα p \le \alpha ,则拒绝 H0 H_0 。 因为 p=0.0718>α=0.05 p=0.0718 > \alpha=0.05 ,所以我们未能拒绝 H0 H_0

  1. 得出结论

两种方法都得到了相同的结论:未能拒绝零假设。因此,在0.05的显著性水平上,虽然样本均值(7880小时)低于宣称的8000小时,但我们没有足够的统计证据来断定制造商关于平均寿命的声明是虚假的。这个差异可能仅仅是由抽样误差引起的。

Z检验与t检验的比较

Z检验和t检验是初学者最容易混淆的两个概念。它们的主要区别在于对总体方差的了解情况:

  • Z检验:要求总体方差 σ2 \sigma^2 已知
  • t检验:用于总体方差 σ2 \sigma^2 未知的情况,此时需要用样本方差 s2 s^2 来估计 σ2 \sigma^2 。t检验使用t分布,该分布考虑了因估计方差而带来的额外不确定性,其形态由自由度(通常为 n1 n-1 )决定。

在实践中,总体方差已知的情况非常罕见。因此,t检验的应用远比Z检验广泛。只有在理论教学、或某些具有长期稳定数据的特定应用场景(如上文提到的质量控制)中,Z检验才会被直接使用。不过,理解Z检验是学习更复杂的假设检验(如t检验、卡方检验等)的重要基础。