ARTICLE

Z统计量

Z统计量 (Z-Statistic) 在统计学中,Z统计量是一种标准化的检验统计量,度量样本估计值与其假设参数值之间距离的标准化倍数——以标准误差为单位。Z统计量在零假设为真时服从(或近似服从)标准正态分布 N(0,1),是假设检验和置信区间构造中最基础的枢轴量之一。 定义与公式 Z统计量的一般形式为: 单样本均值检验(总体方差 ^2 已知): 其中 X 为

浏览 0 更新 2025-10-26

Z统计量 (Z-Statistic)

统计学中,Z统计量是一种标准化的检验统计量,度量样本估计值与其假设参数值之间距离的标准化倍数——以标准误差为单位。Z统计量在零假设为真时服从(或近似服从)标准正态分布 N(0,1)N(0,1),是假设检验置信区间构造中最基础的枢轴量之一。

定义与公式

Z统计量的一般形式为:

Z=估计量假设参数值估计量的标准误差Z = \frac{\text{估计量} - \text{假设参数值}}{\text{估计量的标准误差}}

单样本均值检验(总体方差 σ2\sigma^2 已知):

Z=Xˉμ0σ/nN(0,1)Z = \frac{\bar{X} - \mu_0}{\sigma / \sqrt{n}} \sim N(0,1)

其中 Xˉ\bar{X} 为样本均值,μ0\mu_0 为零假设下的总体均值,σ\sigma 为已知总体标准差,nn 为样本量。分母 σ/n\sigma/\sqrt{n}标准误差

单样本比例检验

Z=p^p0p0(1p0)/nN(0,1)Z = \frac{\hat{p} - p_0}{\sqrt{p_0(1-p_0)/n}} \sim N(0,1)

其中 p^\hat{p} 为样本比例,p0p_0 为零假设下的总体比例。

Z统计量与Z分数

Z分数(Z-score)与Z统计量共享同一数学形式 Z=(Xμ)/σZ = (X - \mu)/\sigma,但语义不同。Z分数是描述性工具:对单一样本观测值 XX 进行标准化,衡量该观测值距总体均值多少个标准差,用于异常值检测、比较不同量纲的变量、或计算正态分布下的百分位数。Z统计量是推断性工具:基于样本统计量的抽样分布,将样本统计量标准化后用于假设检验,其分布特性由中心极限定理保证。

中心极限定理的作用

Z统计量的理论基础是中心极限定理(CLT):当样本量 nn 足够大时(通常 n30n \geq 30),无论总体分布形态如何,Xˉ\bar{X} 的抽样分布近似正态 N(μ,σ2/n)N(\mu, \sigma^2/n)。因此,即使总体非正态,只要 nn 足够大,Z=(Xˉμ0)/(σ/n)Z = (\bar{X} - \mu_0)/(\sigma/\sqrt{n}) 仍近似服从 N(0,1)N(0,1),Z检验仍然有效。这是Z统计量在实践中广泛应用的关键原因。

假设检验中的应用

双侧检验H0:μ=μ0H_0: \mu = \mu_0 vs H1:μμ0H_1: \mu \neq \mu_0。拒绝域:Z>zα/2|Z| > z_{\alpha/2}。例:α=0.05\alpha = 0.05 时,临界值 z0.025=1.96z_{0.025} = 1.96

右侧检验H0:μμ0H_0: \mu \leq \mu_0 vs H1:μ>μ0H_1: \mu > \mu_0。拒绝域:Z>zαZ > z_{\alpha}

左侧检验H0:μμ0H_0: \mu \geq \mu_0 vs H1:μ<μ0H_1: \mu < \mu_0。拒绝域:Z<zαZ < -z_{\alpha}

常用临界值:α=0.10z=1.645\alpha = 0.10 \to z = 1.645α=0.05z=1.96\alpha = 0.05 \to z = 1.96α=0.01z=2.576\alpha = 0.01 \to z = 2.576

p值法:p值 = 在零假设为真时,观察到比当前Z统计量更极端值的概率。若 p值<α\text{p值} < \alpha,拒绝 H0H_0。p值提供了比"拒绝/不拒绝"二分决策更丰富的信息量。

置信区间构造

基于Z统计量的 100(1α)%100(1-\alpha)\% 置信区间(σ\sigma 已知):

Xˉ±zα/2σn\bar{X} \pm z_{\alpha/2} \cdot \frac{\sigma}{\sqrt{n}}

置信区间与双侧Z检验等价:若 μ0\mu_0 落入该区间,则双侧Z检验在水平 α\alpha 下不拒绝 H0:μ=μ0H_0: \mu = \mu_0。这一对偶性统一了区间估计假设检验两大框架。

Z检验与t检验的选择

实际应用中,总体标准差 σ\sigma 几乎总是未知的,此时应使用t统计量t=(Xˉμ0)/(s/n)tn1t = (\bar{X} - \mu_0)/(s/\sqrt{n}) \sim t_{n-1}。然而,当样本量 nn 很大(如 n>100n > 100)时,t分布接近标准正态分布,Z检验与t检验给出的结果差异很小。历史上,在计算能力有限的年代,统计学家常用Z检验近似大样本t检验;现代软件则普遍输出精确t检验结果。经验法则σ\sigma 已知用Z,σ\sigma 未知用t,大样本下两者近似等价。

双样本Z检验

比较两个独立总体的均值,设两总体方差 σ12,σ22\sigma_1^2, \sigma_2^2 已知:

Z=(Xˉ1Xˉ2)(μ1μ2)0σ12n1+σ22n2N(0,1)Z = \frac{(\bar{X}_1 - \bar{X}_2) - (\mu_1 - \mu_2)_0}{\sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}} \sim N(0,1)

通常零假设为 H0:μ1μ2=0H_0: \mu_1 - \mu_2 = 0(无差异)。该检验常用于A/B测试、临床试验疗效比较、计量经济学中的政策效应评估。两总体比例差检验同理,使用合并比例估计标准误差。

检验功效与样本量

Z检验的功效函数(Power)依赖于效应量 d=μμ0/σd = |\mu - \mu_0|/\sigma、样本量 nn 和显著性水平 α\alpha。对于给定的效应量和期望功效 1β1-\beta(通常取0.8),最小所需样本量为:

n=(zα/2+zβ)2σ2(μμ0)2n = \frac{(z_{\alpha/2} + z_{\beta})^2 \cdot \sigma^2}{(\mu - \mu_0)^2}

该公式是实验设计和功效分析的基础:效应越小、期望功效越高,所需样本量越大。Z统计量的标准化特性使公式在不同度量单位下保持一致。

关键假设与局限性

Z检验成立的关键假设:①样本为简单随机样本(独立同分布);②σ\sigma 已知(实践中罕见);③若总体正态,小样本也可用Z;若总体非正态,需大样本由CLT保证近似正态性;④比例检验还需满足 np010np_0 \geq 10n(1p0)10n(1-p_0) \geq 10(正态近似条件)。

当假设不成立时,Z统计量可能给出误导性结论。例如,厚尾分布下样本均值的收敛速度远慢于正态近似预期;异方差下标准误差估计失真;样本非独立时(如时间序列中的自相关),标准误差被低估,Z统计量膨胀,导致第一类错误率上升。

实例:产品质量控制

某工厂声称其生产的螺栓平均直径为10mm,已知工序标准差 σ=0.3\sigma = 0.3mm。质检员随机抽取 n=36n=36 个螺栓,测得 Xˉ=10.15\bar{X} = 10.15mm。在 α=0.05\alpha = 0.05 下检验声称是否可信:

Z=10.15100.3/36=0.150.05=3.00Z = \frac{10.15 - 10}{0.3/\sqrt{36}} = \frac{0.15}{0.05} = 3.00

Z=3.00>1.96=z0.025|Z| = 3.00 > 1.96 = z_{0.025},拒绝 H0H_0。相应的p值 =2×P(Z>3.00)=0.0027= 2 \times P(Z > 3.00) = 0.0027,远小于0.05,表明观测到的偏离极不可能是随机波动所致——有充分证据认为螺栓直径已偏离标称值,需调整产线。该例展示了Z统计量在统计过程控制中的典型应用:将原始测量值标准化后,利用标准正态分布的临界值做出客观判断,避免主观臆断。