ARTICLE

威尔科克森符号秩检验

威尔科克森符号秩检验 (Wilcoxon Signed-Rank Test) 威尔科克森符号秩检验(Wilcoxon Signed-Rank Test)是一种用于比较两个配对样本(paired samples)或重复测量数据之间差异的非参数检验方法。该检验由美国化学家兼统计学家弗兰克·威尔科克森(Frank Wilcoxon)于1945年提出,是统计学中最常

浏览 3 更新 2025-10-26

威尔科克森符号秩检验 (Wilcoxon Signed-Rank Test)

威尔科克森符号秩检验(Wilcoxon Signed-Rank Test)是一种用于比较两个配对样本(paired samples)或重复测量数据之间差异的非参数检验方法。该检验由美国化学家兼统计学家弗兰克·威尔科克森(Frank Wilcoxon)于1945年提出,是统计学中最常用的配对非参数检验之一,常被视为配对t检验的非参数替代方案。与配对t检验不同,符号秩检验不要求数据服从正态分布,仅要求差异数据的分布具有对称性,因此在对数据分布形态不确定时具有更强的稳健性。

方法原理

威尔科克森符号秩检验的核心思想是:计算每对观测值的差值,忽略差值的符号将其绝对值排序(赋予秩次),然后将原始符号重新附加到秩次上,构造正秩和与负秩和作为检验统计量。其基本步骤如下:

第一,计算配对观测值之差 di=xiyid_i = x_i - y_i,其中 i=1,2,,ni = 1, 2, \ldots, n,剔除差值为零的配对。第二,将非零差值的绝对值 di|d_i| 从小到大排序,赋予秩次 rir_i(相同绝对值取平均秩)。第三,将符号重新附加到秩次上,得到带符号秩 si=sgn(di)ris_i = \text{sgn}(d_i) \cdot r_i。第四,分别计算正秩和 W+=si>0siW^+ = \sum_{s_i > 0} s_i 与负秩和 W=si<0siW^- = \sum_{s_i < 0} |s_i|。检验统计量 W=min(W+,W)W = \min(W^+, W^-),在小样本下参照精确分布表,在大样本下则利用正态近似进行推断。

假设设定

双侧检验的原假设为 H0:H_0: 配对差值分布的中位数为零,即 Md=0M_d = 0;备择假设为 H1:Md0H_1: M_d \neq 0。单侧检验可检验差值中位数是否大于或小于零。值得注意的是,该检验实际上检验的是差值分布关于零的对称性——如果差值分布的中位数为零且分布对称,则正秩和与负秩和应大致相等。

大样本近似与效应量

当样本量 n20n \geq 20 时,在 H0H_0 下统计量 W+W^+ 的分布近似于正态分布,其均值为 μW=n(n+1)/4\mu_W = n(n+1)/4,方差为 σW2=n(n+1)(2n+1)/24\sigma_W^2 = n(n+1)(2n+1)/24。当数据中存在结(ties,即相同的绝对差值)时,需对方差进行校正:σW2=n(n+1)(2n+1)24tj3tj48\sigma_W^2 = \frac{n(n+1)(2n+1)}{24} - \frac{\sum t_j^3 - \sum t_j}{48},其中 tjt_j 为第 jj 个结组的大小。

常用的效应量指标包括:r=Z/nr = Z / \sqrt{n}(其中 ZZ 为标准化检验统计量),以及匹配秩双列相关(matched-pairs rank biserial correlation)rc=14Wn(n+1)r_c = 1 - \frac{4W}{n(n+1)}。这些效应量可参照 Cohen 的标准进行解读:0.1(小效应)、0.3(中效应)、0.5(大效应)。

与相关方法的比较

威尔科克森符号秩检验与以下几种方法密切相关:

符号检验(Sign Test)更早(Arbuthnott, 1710)但仅利用差值的符号信息而忽略其大小,统计效率较低。配对t检验利用差值的具体数值而非秩次,在数据满足正态性假设时具有最优功效(一致性最优无偏检验),但偏离正态假设时其第一类错误率可能失控。威尔科克森符号秩检验在正态分布下的渐近相对效率(ARE)约为 0.955,意味着它仅以约 4.5\% 的功效损失换取了广泛的稳健性。

对于独立(非配对)两组样本的比较,应使用曼-惠特尼U检验(Mann-Whitney U Test,亦称 Wilcoxon Rank-Sum Test),而非符号秩检验。

应用场景与注意事项

威尔科克森符号秩检验广泛应用于生物统计学心理学经济学医学研究等领域中的配对设计实验,例如:同一组受试者在干预前后的测量值对比、两种不同测量方法在同一批样本上的结果比较、以及匹配组设计中的配对比较。

使用该检验时需注意:第一,虽不要求正态性,但要求差值分布大致对称——若分布严重偏斜,符号秩检验的功效会下降,此时可考虑符号检验。第二,样本量过小(n<6n < 6)时检验功效极为有限,且无法在通常的显著性水平下拒绝原假设。第三,存在大量结时检验的精确性会受影响,应优先使用带结校正的版本或精确条件分布。

威尔科克森符号秩检验以其简洁的假设条件和良好的稳健性,成为非参数统计工具箱中最基础也最有力的工具之一,在数据分析实践中具有不可替代的地位。