Z统计量 (Z-Statistic)
在统计学 中,Z统计量 是一种标准化的检验统计量,度量样本估计值与其假设参数值之间距离的标准化倍数——以标准误差为单位。Z统计量在零假设为真时服从(或近似服从)标准正态分布 N ( 0 , 1 ) N(0,1) N ( 0 , 1 ) ,是假设检验 和置信区间 构造中最基础的枢轴量之一。
定义与公式
Z统计量的一般形式为:
Z = 估计量 − 假设参数值 估计量的标准误差 Z = \frac{\text{估计量} - \text{假设参数值}}{\text{估计量的标准误差}} Z = 估计量的标准误差 估计量 − 假设参数值
单样本均值检验 (总体方差 σ 2 \sigma^2 σ 2 已知):
Z = X ˉ − μ 0 σ / n ∼ N ( 0 , 1 ) Z = \frac{\bar{X} - \mu_0}{\sigma / \sqrt{n}} \sim N(0,1) Z = σ / n X ˉ − μ 0 ∼ N ( 0 , 1 )
其中 X ˉ \bar{X} X ˉ 为样本均值,μ 0 \mu_0 μ 0 为零假设下的总体均值,σ \sigma σ 为已知总体标准差,n n n 为样本量。分母 σ / n \sigma/\sqrt{n} σ / n 即标准误差 。
单样本比例检验 :
Z = p ^ − p 0 p 0 ( 1 − p 0 ) / n ∼ N ( 0 , 1 ) Z = \frac{\hat{p} - p_0}{\sqrt{p_0(1-p_0)/n}} \sim N(0,1) Z = p 0 ( 1 − p 0 ) / n p ^ − p 0 ∼ N ( 0 , 1 )
其中 p ^ \hat{p} p ^ 为样本比例,p 0 p_0 p 0 为零假设下的总体比例。
Z统计量与Z分数
Z分数 (Z-score)与Z统计量共享同一数学形式 Z = ( X − μ ) / σ Z = (X - \mu)/\sigma Z = ( X − μ ) / σ ,但语义不同。Z分数是描述性工具:对单一样本观测值 X X X 进行标准化,衡量该观测值距总体均值多少个标准差,用于异常值检测 、比较不同量纲的变量、或计算正态分布 下的百分位数。Z统计量是推断性工具:基于样本统计量的抽样分布,将样本统计量标准化后用于假设检验,其分布特性由中心极限定理 保证。
中心极限定理的作用
Z统计量的理论基础是中心极限定理 (CLT):当样本量 n n n 足够大时(通常 n ≥ 30 n \geq 30 n ≥ 30 ),无论总体分布形态如何,X ˉ \bar{X} X ˉ 的抽样分布近似正态 N ( μ , σ 2 / n ) N(\mu, \sigma^2/n) N ( μ , σ 2 / n ) 。因此,即使总体非正态,只要 n n n 足够大,Z = ( X ˉ − μ 0 ) / ( σ / n ) Z = (\bar{X} - \mu_0)/(\sigma/\sqrt{n}) Z = ( X ˉ − μ 0 ) / ( σ / n ) 仍近似服从 N ( 0 , 1 ) N(0,1) N ( 0 , 1 ) ,Z检验仍然有效。这是Z统计量在实践中广泛应用的关键原因。
假设检验中的应用
双侧检验 :H 0 : μ = μ 0 H_0: \mu = \mu_0 H 0 : μ = μ 0 vs H 1 : μ ≠ μ 0 H_1: \mu \neq \mu_0 H 1 : μ = μ 0 。拒绝域:∣ Z ∣ > z α / 2 |Z| > z_{\alpha/2} ∣ Z ∣ > z α /2 。例:α = 0.05 \alpha = 0.05 α = 0.05 时,临界值 z 0.025 = 1.96 z_{0.025} = 1.96 z 0.025 = 1.96 。
右侧检验 :H 0 : μ ≤ μ 0 H_0: \mu \leq \mu_0 H 0 : μ ≤ μ 0 vs H 1 : μ > μ 0 H_1: \mu > \mu_0 H 1 : μ > μ 0 。拒绝域:Z > z α Z > z_{\alpha} Z > z α 。
左侧检验 :H 0 : μ ≥ μ 0 H_0: \mu \geq \mu_0 H 0 : μ ≥ μ 0 vs H 1 : μ < μ 0 H_1: \mu < \mu_0 H 1 : μ < μ 0 。拒绝域:Z < − z α Z < -z_{\alpha} Z < − z α 。
常用临界值:α = 0.10 → z = 1.645 \alpha = 0.10 \to z = 1.645 α = 0.10 → z = 1.645 ;α = 0.05 → z = 1.96 \alpha = 0.05 \to z = 1.96 α = 0.05 → z = 1.96 ;α = 0.01 → z = 2.576 \alpha = 0.01 \to z = 2.576 α = 0.01 → z = 2.576 。
p值法 :p值 = 在零假设为真时,观察到比当前Z统计量更极端值的概率。若 p值 < α \text{p值} < \alpha p 值 < α ,拒绝 H 0 H_0 H 0 。p值提供了比"拒绝/不拒绝"二分决策更丰富的信息量。
置信区间构造
基于Z统计量的 100 ( 1 − α ) % 100(1-\alpha)\% 100 ( 1 − α ) % 置信区间(σ \sigma σ 已知):
X ˉ ± z α / 2 ⋅ σ n \bar{X} \pm z_{\alpha/2} \cdot \frac{\sigma}{\sqrt{n}} X ˉ ± z α /2 ⋅ n σ
置信区间与双侧Z检验等价:若 μ 0 \mu_0 μ 0 落入该区间,则双侧Z检验在水平 α \alpha α 下不拒绝 H 0 : μ = μ 0 H_0: \mu = \mu_0 H 0 : μ = μ 0 。这一对偶性统一了区间估计 与假设检验 两大框架。
Z检验与t检验的选择
实际应用中,总体标准差 σ \sigma σ 几乎总是未知的,此时应使用t统计量 :t = ( X ˉ − μ 0 ) / ( s / n ) ∼ t n − 1 t = (\bar{X} - \mu_0)/(s/\sqrt{n}) \sim t_{n-1} t = ( X ˉ − μ 0 ) / ( s / n ) ∼ t n − 1 。然而,当样本量 n n n 很大(如 n > 100 n > 100 n > 100 )时,t分布接近标准正态分布,Z检验与t检验给出的结果差异很小。历史上,在计算能力有限的年代,统计学家常用Z检验近似大样本t检验;现代软件则普遍输出精确t检验结果。经验法则 :σ \sigma σ 已知用Z,σ \sigma σ 未知用t,大样本下两者近似等价。
双样本Z检验
比较两个独立总体的均值,设两总体方差 σ 1 2 , σ 2 2 \sigma_1^2, \sigma_2^2 σ 1 2 , σ 2 2 已知:
Z = ( X ˉ 1 − X ˉ 2 ) − ( μ 1 − μ 2 ) 0 σ 1 2 n 1 + σ 2 2 n 2 ∼ N ( 0 , 1 ) Z = \frac{(\bar{X}_1 - \bar{X}_2) - (\mu_1 - \mu_2)_0}{\sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}} \sim N(0,1) Z = n 1 σ 1 2 + n 2 σ 2 2 ( X ˉ 1 − X ˉ 2 ) − ( μ 1 − μ 2 ) 0 ∼ N ( 0 , 1 )
通常零假设为 H 0 : μ 1 − μ 2 = 0 H_0: \mu_1 - \mu_2 = 0 H 0 : μ 1 − μ 2 = 0 (无差异)。该检验常用于A/B测试、临床试验疗效比较、计量经济学 中的政策效应评估。两总体比例差检验同理,使用合并比例估计标准误差。
检验功效与样本量
Z检验的功效函数 (Power)依赖于效应量 d = ∣ μ − μ 0 ∣ / σ d = |\mu - \mu_0|/\sigma d = ∣ μ − μ 0 ∣/ σ 、样本量 n n n 和显著性水平 α \alpha α 。对于给定的效应量和期望功效 1 − β 1-\beta 1 − β (通常取0.8),最小所需样本量为:
n = ( z α / 2 + z β ) 2 ⋅ σ 2 ( μ − μ 0 ) 2 n = \frac{(z_{\alpha/2} + z_{\beta})^2 \cdot \sigma^2}{(\mu - \mu_0)^2} n = ( μ − μ 0 ) 2 ( z α /2 + z β ) 2 ⋅ σ 2
该公式是实验设计和功效分析 的基础:效应越小、期望功效越高,所需样本量越大。Z统计量的标准化特性使公式在不同度量单位下保持一致。
关键假设与局限性
Z检验成立的关键假设:①样本为简单随机样本 (独立同分布);②σ \sigma σ 已知(实践中罕见);③若总体正态,小样本也可用Z;若总体非正态,需大样本由CLT保证近似正态性;④比例检验还需满足 n p 0 ≥ 10 np_0 \geq 10 n p 0 ≥ 10 且 n ( 1 − p 0 ) ≥ 10 n(1-p_0) \geq 10 n ( 1 − p 0 ) ≥ 10 (正态近似条件)。
当假设不成立时,Z统计量可能给出误导性结论。例如,厚尾分布 下样本均值的收敛速度远慢于正态近似预期;异方差 下标准误差估计失真;样本非独立时(如时间序列 中的自相关),标准误差被低估,Z统计量膨胀,导致第一类错误率上升。
实例:产品质量控制
某工厂声称其生产的螺栓平均直径为10mm,已知工序标准差 σ = 0.3 \sigma = 0.3 σ = 0.3 mm。质检员随机抽取 n = 36 n=36 n = 36 个螺栓,测得 X ˉ = 10.15 \bar{X} = 10.15 X ˉ = 10.15 mm。在 α = 0.05 \alpha = 0.05 α = 0.05 下检验声称是否可信:
Z = 10.15 − 10 0.3 / 36 = 0.15 0.05 = 3.00 Z = \frac{10.15 - 10}{0.3/\sqrt{36}} = \frac{0.15}{0.05} = 3.00 Z = 0.3/ 36 10.15 − 10 = 0.05 0.15 = 3.00
∣ Z ∣ = 3.00 > 1.96 = z 0.025 |Z| = 3.00 > 1.96 = z_{0.025} ∣ Z ∣ = 3.00 > 1.96 = z 0.025 ,拒绝 H 0 H_0 H 0 。相应的p值 = 2 × P ( Z > 3.00 ) = 0.0027 = 2 \times P(Z > 3.00) = 0.0027 = 2 × P ( Z > 3.00 ) = 0.0027 ,远小于0.05,表明观测到的偏离极不可能是随机波动所致——有充分证据认为螺栓直径已偏离标称值,需调整产线。该例展示了Z统计量在统计过程控制 中的典型应用:将原始测量值标准化后,利用标准正态分布的临界值做出客观判断,避免主观臆断。
关于知经 KNOWECON
知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌,长期面向北京大学、清华大学、中国人民大学等顶尖院校,提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考,并成功进入理想院校。
知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业,获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者,长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。
我们相信,好的考研辅导不只是押题和陪跑,更是把复杂知识讲清楚、把复习路径设计清楚,并用技术让学习过程更可追踪、更可反馈、更可坚持。