ARTICLE

比例检验

比例检验 (Proportion Test) 比例检验(Proportion Test),也称比例的Z检验,是假设检验中的一种重要方法,专门用于检验关于一个或多个总体中某个特征所占比例或概率的声明是否成立。该方法在社会科学、医学研究、市场调查和质量控制等领域有着广泛应用,例如检验新药的治愈率是否高于传统药物,或产品的市场占有率是否达到预定目标。其核心思想是利

浏览 2 更新 2025-11-03

比例检验 (Proportion Test)

比例检验(Proportion Test),也称比例的Z检验,是假设检验中的一种重要方法,专门用于检验关于一个或多个总体中某个特征所占比例概率的声明是否成立。该方法在社会科学、医学研究、市场调查和质量控制等领域有着广泛应用,例如检验新药的治愈率是否高于传统药物,或产品的市场占有率是否达到预定目标。其核心思想是利用样本数据计算样本比例 p^\hat{p},进而评估总体真实比例 pp 是否与预先假设值 p0p_0 或另一个总体比例存在统计学意义上的差异。

理论基础与检验类型

比例检验的理论基础是中心极限定理。当样本量足够大时,样本比例 p^\hat{p}抽样分布近似于正态分布,其均值为 E[p^]=p\mathbb{E}[\hat{p}] = p,标准误为 SE[p^]=p(1p)/n\operatorname{SE}[\hat{p}] = \sqrt{p(1-p)/n}。在原假设 H0:p=p0H_0: p = p_0 下,检验统计量经标准化后为 Z=(p^p0)/p0(1p0)/nZ = (\hat{p} - p_0)/\sqrt{p_0(1-p_0)/n},近似服从标准正态分布。适用条件要求样本量足够大,通常的经验准则为 np05n p_0 \ge 5n(1p0)5n(1-p_0) \ge 5,此时二项分布充分对称且呈钟形,正态近似效果良好。

比例检验主要包括三种类型。单样本比例检验用于检验单个总体比例是否等于某特定值 p0p_0。其Z统计量如上所述,双侧p值等于 2P(Z>zobs)2P(Z > |z_{\text{obs}}|),常用于判断产品缺陷率是否达标等问题。两独立样本比例检验用于比较两个独立总体的比例是否相等,原假设为 H0:p1=p2H_0: p_1 = p_2。此时使用合并比例 p^p=(x1+x2)/(n1+n2)\hat{p}_p = (x_1 + x_2)/(n_1 + n_2) 作为总体比例的最佳估计,因为在原假设成立时两样本来自同一总体。Z统计量为 Z=(p^1p^2)/p^p(1p^p)(1/n1+1/n2)Z = (\hat{p}_1 - \hat{p}_2)/\sqrt{\hat{p}_p(1-\hat{p}_p)(1/n_1 + 1/n_2)},标准误使用合并比例计算。当不假设两总体方差相等时,也可使用不合并的Welch型版本。配对比例检验即McNemar检验,用于前后测量设计,基于同一受试前后二元反应的不一致对进行比较。

替代方法与注意事项

当样本量较小或比例接近0或1时,正态近似失效,此时应使用二项分布本身的精确分布。Fisher精确检验二项检验提供精确的p值,基于二项分布而非正态近似。在置信区间的构造中,标准误中的 pp 未知,通常用 p^\hat{p} 替代,得到Wald置信区间,但这是近似的。小样本时覆盖概率可能偏低,Wilson得分区间Agresti-Coull区间等改良方法能够提供更准确的覆盖率性能。比例检验在AB测试选举民调临床试验中属于最常用的统计工具之一,它成功连接了二项试验的直观解释与正态理论的数学便利性。