ARTICLE

威尔科克森秩和检验

%% id: 7079 word: "威尔科克森秩和检验" created\_model: "stub" verified: true verified\_at: "2025-12-11T09:51:08" created\_by\_id: 588 view\_counts: 0 inserted\_at: "2025-12-11T09:51:08" upd

浏览 0

%%

id: 7079 word: "威尔科克森秩和检验" created\_model: "stub" verified: true verified\_at: "2025-12-11T09:51:08" created\_by\_id: 588 view\_counts: 0 inserted\_at: "2025-12-11T09:51:08" updated\_at: "2025-12-11T09:51:08" \%\%

威尔科克森秩和检验(Wilcoxon Rank-Sum Test),又称曼-惠特尼U检验(Mann-Whitney U Test),是一种非参数统计检验方法,用于比较两个独立样本是否来自同一总体。该方法由弗兰克·威尔科克森(Frank Wilcoxon)于1945年提出,后由亨利·曼(Henry Mann)和唐纳德·惠特尼(Donald Whitney)于1947年加以扩展和完善。由于不要求数据服从正态分布,该检验在理论和应用上都具有重要地位。

基本原理

威尔科克森秩和检验的核心思想是将两个样本的观测值合并后按大小排序,赋予每个观测值一个秩次(rank),然后基于秩次之和来判断两个样本是否存在显著差异。与参数检验中的独立样本t检验不同,秩和检验仅依赖数据的相对顺序而非具体数值,因此对异常值不敏感,适用性更广。

具体而言,设两个独立样本的容量分别为 m m n n ,总体本容量为 N=m+n N = m + n 。将全部 N N 个观测值从小到大排列,赋予秩次 1,2,,N 1, 2, \dots, N 。若存在相同数值(结),则取平均秩。计算第一个样本的秩和 R1 R_1 ,则曼-惠特尼U统计量定义为:

U1=R1m(m+1)2,U2=R2n(n+1)2U_1 = R_1 - \frac{m(m+1)}{2}, \quad U_2 = R_2 - \frac{n(n+1)}{2}

其中 U1+U2=mn U_1 + U_2 = mn 。实际检验中取 U=min(U1,U2) U = \min(U_1, U_2) 作为检验统计量。

假设与适用条件

该检验的原假设 H0 H_0 为两个总体分布相同,备择假设 H1 H_1 为两个总体分布位置不同(即一个总体的值倾向于大于另一个)。检验的适用条件包括:(1)两个样本相互独立;(2)数据至少为有序尺度(ordinal scale);(3)两组数据的分布形状大致相同(若仅关注位置差异)。相比t检验,秩和检验无需满足正态性和方差齐性假设,在小样本或非正态数据中尤为适用。

检验步骤

第一步,将两组数据合并排序,计算每个观测值的秩次。第二步,分别计算两组秩和 R1 R_1 R2 R_2 。第三步,计算U统计量。第四步,根据显著性水平 α \alpha 查表或使用正态近似计算p值。当 m m n n 均较大时(通常 m,n10 m, n \geq 10 ),U统计量近似服从正态分布:

z=Umn2mn(N+1)12z = \frac{U - \frac{mn}{2}}{\sqrt{\frac{mn(N+1)}{12}}}

若存在结(tie),需对标准差进行校正:

σU=mn12(N+1i=1k(ti3ti)N(N1))\sigma_U = \sqrt{\frac{mn}{12} \left( N+1 - \frac{\sum_{i=1}^{k} (t_i^3 - t_i)}{N(N-1)} \right)}

其中 k k 为结的组数,ti t_i 为第 i i 组结中相同秩次的个数。

与符号秩检验的区别

威尔科克森秩和检验(针对独立样本)与威尔科克森符号秩检验(Wilcoxon Signed-Rank Test,针对配对样本)是两种不同的方法。符号秩检验用于配对数据或单样本中位数的检验,而秩和检验用于两个独立样本的比较。两者均以其秩次为基础,但应用场景截然不同。

应用实例

假设研究者希望比较两种肥料对作物产量的影响。由于产量数据可能不满足正态性,可采用秩和检验。从两种肥料各取10个样本,合并排序后计算秩和与U统计量,若p值小于0.05,则拒绝原假设,认为两种肥料的效果存在显著差异。

优缺点

该检验的主要优点包括:无需正态分布假设、对异常值稳健、适用于有序数据、在小样本中表现良好。主要缺点为:当数据确为正态分布时,其检验功效(power)低于t检验;无法直接估计效应量的大小(但可通过计算概率指数 P^(X>Y)=U/(mn) \hat{P}(X>Y) = U/(mn) 来间接度量);对分布形状差异较为敏感。

软件实现

主流统计软件均支持该检验。R语言中使用 \texttt{wilcox.test(x, y)} 函数;Python的SciPy库提供 \texttt{mannwhitneyu(x, y)};Stata中使用 \texttt{ranksum} 命令;SPSS中通过"分析→非参数检验→旧对话框→2个独立样本"操作实现。

总结

威尔科克森秩和检验作为一种经典的非参数检验方法,在医学、生物学、经济学、心理学等众多领域得到广泛应用。它为解决非正态数据的两组比较问题提供了简单而有效的工具,是参数t检验的重要补充。正确理解其原理、适用条件和局限性,对于科学合理地选择统计方法具有重要意义。