ARTICLE
曼-惠特尼U检验临界值表
曼-惠特尼U检验临界值表 (Mann-Whitney U Test Critical Values Table) 曼-惠特尼U检验临界值表是执行曼-惠特尼U检验(Mann-Whitney U test,亦称威尔科克森秩和检验)时用于判断统计显著性的预计算数值表。该表列出了在零假设(两组样本来自同一总体)成立的前提下,不同样本量组合所对应的U统计量的临界值。研
曼-惠特尼U检验临界值表 (Mann-Whitney U Test Critical Values Table)
曼-惠特尼U检验临界值表是执行曼-惠特尼U检验(Mann-Whitney U test,亦称威尔科克森秩和检验)时用于判断统计显著性的预计算数值表。该表列出了在零假设(两组样本来自同一总体)成立的前提下,不同样本量组合所对应的U统计量的临界值。研究者将计算得到的U统计量与表中临界值进行比较:若U值小于或等于临界值,则拒绝零假设,判定两组之间存在统计显著的差异。
临界值表的构造原理
曼-惠特尼U检验是一种非参数检验方法,其有效性不依赖于总体分布的具体形态,仅基于两组独立样本的秩信息。设第一个样本的容量为 ,第二个样本的容量为 ,将两组数据合并后按升序排列,计算第一个样本中每个观测值所对应的秩之和 ,则U统计量的计算公式为:
该统计量的直观含义是:将第一个样本的每一个观测值与第二个样本的所有观测值逐一比较,计数第一个样本中观测值大于第二个样本中观测值的次数。在零假设(两组来自同一分布)成立的条件下,U统计量的抽样分布仅取决于 和 这两个参数,而与总体分布的具体形式完全无关。这一性质被称为分布无关性(distribution-free property),是非参数检验相对于参数检验的核心优势。
当 和 均较小时(通常约定各不超过20),U的精确分布可以通过组合数学方法枚举所有可能的秩分配结果而得到。具体而言,在零假设下,所有 种秩分配方式等可能发生,U统计量的概率质量函数可直接由组合计数导出。临界值表正是基于这一精确分布编制而成的:对于每一组 组合,表中列出对应于不同显著性水平 (常见取值为0.05、0.025和0.01,通常对应于双尾检验)的临界值 ,其定义满足:
表的结构与使用方式
临界值表通常以矩阵形式组织,行和列分别对应 和 的取值(典型范围从3到20)。每个单元格中按显著性水平分栏列出临界值,常见格式包括:在同一格内分行排列不同 所对应的临界值,或以括号标注对应的精确p值。由于U统计量的分布关于其理论均值 对称,表中通常仅列示左侧临界值(即较小的一侧);若需执行双尾检验,只需取 与表中临界值对照即可。
使用临界值表的具体步骤如下:第一步,分别计算两组样本的秩和并得到U统计量;第二步,根据样本量 组合和选定的显著性水平,在表中查找对应的临界值;第三步,将计算所得的U值与临界值进行比较——若U值小于或等于临界值,则在相应显著性水平下拒绝零假设。举例说明:假设 、,在双尾 的水平下,查表得临界值为17。若计算得到 ,由于 ,可以判定两组之间存在统计显著的差异。
大样本近似与表的局限性
当 和 较大时(通常认为各超过20),U统计量在零假设下近似服从正态分布,其均值和方差分别为:
此时可构造标准化z统计量 ,将其与标准正态分布的临界值进行比较,从而做出统计推断,无需再查阅专门的U检验临界值表。当样本数据中存在结(tied ranks,即多个观测值的数值完全相同)时,方差公式需引入校正项:
其中 表示结的组数, 表示第 组结中所包含的观测值个数。该校正项旨在修正秩次重复对U统计量方差造成的低估效应。
临界值表的主要局限性体现在以下三个方面:其一,适用范围有限——仅适用于小样本情形,超出表中所列范围需借助大样本近似或蒙特卡洛模拟方法得到p值;其二,检验的保守性——由于U统计量的分布是离散的,表中临界值所对应的实际第一类错误概率可能严格小于名义显著性水平 ,从而导致检验偏于保守,检验功效有所降低;其三,版本差异——不同统计教材和统计软件所给出的临界值可能存在细微差异(例如是否包含连续性校正),研究者在引用时需注意来源的一致性。
历史与背景
曼-惠特尼U检验由亨利·曼(Henry Mann)和唐纳德·惠特尼(Donald Whitney)于1947年发表,其临界值表随之问世。几乎在同一时期,弗兰克·威尔科克森(Frank Wilcoxon)于1945年提出了等价的双样本秩和检验(Wilcoxon rank-sum test)。两套检验在数学上完全等价:威尔科克森提出的 统计量与曼-惠特尼的 统计量之间满足关系式 。因此,曼-惠特尼U检验临界值表与威尔科克森秩和检验临界值表本质上是同一张表的不同呈现形式。
该检验及其临界值表在生物统计学、医学统计、社会科学、心理学和经济学等学科中得到了广泛应用,尤其适用于样本量较小、数据不满足正态性假设或存在异常值的情形。曼-惠特尼U检验是独立样本t检验的非参数替代方案:在零假设成立且正态性假设满足的条件下,其渐近相对效率(ARE)约为0.955,即仅以约5\%的效率损失换取了更强的稳健性;而当数据严重偏离正态分布时,它往往比t检验具有更高的检验功效。
现代计算实践
随着计算机技术的普及,现代统计软件已经能够直接计算曼-惠特尼U检验的精确p值或基于正态近似的p值,手动查表的传统做法正在逐步被取代。在R语言中,\verb|wilcox.test()|函数默认计算精确p值(当无结且样本量较小时)或使用正态近似(含连续性校正);在Python中,\verb|scipy.stats.mannwhitneyu|函数提供了类似的功能;SPSS、Stata、SAS等商业统计软件也均内置了该检验方法。尽管如此,临界值表作为该检验方法论的基础组成部分,在统计教学、考试命题和快速参照场景中仍具有不可替代的价值。标准的临界值表收录于Nonparametric Statistical Methods(Hollander, Wolfe \& Chicken, 2014)、Statistical Methods for Psychology(Howell, 2013)以及Introduction to the Practice of Statistics(Moore, McCabe \& Craig, 2021)等经典教材的附录之中。此外,NIST/SEMATECH e-Handbook of Statistical Methods等在线资源也提供了可直接查阅的临界值数据。