ARTICLE
威尔科克森符号秩检验
威尔科克森符号秩检验 (Wilcoxon Signed-Rank Test) 威尔科克森符号秩检验(Wilcoxon Signed-Rank Test)是一种用于比较两个配对样本(paired samples)或重复测量数据之间差异的非参数检验方法。该检验由美国化学家兼统计学家弗兰克·威尔科克森(Frank Wilcoxon)于1945年提出,是统计学中最常
威尔科克森符号秩检验 (Wilcoxon Signed-Rank Test)
威尔科克森符号秩检验(Wilcoxon Signed-Rank Test)是一种用于比较两个配对样本(paired samples)或重复测量数据之间差异的非参数检验方法。该检验由美国化学家兼统计学家弗兰克·威尔科克森(Frank Wilcoxon)于1945年提出,是统计学中最常用的配对非参数检验之一,常被视为配对t检验的非参数替代方案。与配对t检验不同,符号秩检验不要求数据服从正态分布,仅要求差异数据的分布具有对称性,因此在对数据分布形态不确定时具有更强的稳健性。
方法原理
威尔科克森符号秩检验的核心思想是:计算每对观测值的差值,忽略差值的符号将其绝对值排序(赋予秩次),然后将原始符号重新附加到秩次上,构造正秩和与负秩和作为检验统计量。其基本步骤如下:
第一,计算配对观测值之差 ,其中 ,剔除差值为零的配对。第二,将非零差值的绝对值 从小到大排序,赋予秩次 (相同绝对值取平均秩)。第三,将符号重新附加到秩次上,得到带符号秩 。第四,分别计算正秩和 与负秩和 。检验统计量 ,在小样本下参照精确分布表,在大样本下则利用正态近似进行推断。
假设设定
双侧检验的原假设为 配对差值分布的中位数为零,即 ;备择假设为 。单侧检验可检验差值中位数是否大于或小于零。值得注意的是,该检验实际上检验的是差值分布关于零的对称性——如果差值分布的中位数为零且分布对称,则正秩和与负秩和应大致相等。
大样本近似与效应量
当样本量 时,在 下统计量 的分布近似于正态分布,其均值为 ,方差为 。当数据中存在结(ties,即相同的绝对差值)时,需对方差进行校正:,其中 为第 个结组的大小。
常用的效应量指标包括:(其中 为标准化检验统计量),以及匹配秩双列相关(matched-pairs rank biserial correlation)。这些效应量可参照 Cohen 的标准进行解读:0.1(小效应)、0.3(中效应)、0.5(大效应)。
与相关方法的比较
威尔科克森符号秩检验与以下几种方法密切相关:
符号检验(Sign Test)更早(Arbuthnott, 1710)但仅利用差值的符号信息而忽略其大小,统计效率较低。配对t检验利用差值的具体数值而非秩次,在数据满足正态性假设时具有最优功效(一致性最优无偏检验),但偏离正态假设时其第一类错误率可能失控。威尔科克森符号秩检验在正态分布下的渐近相对效率(ARE)约为 0.955,意味着它仅以约 4.5\% 的功效损失换取了广泛的稳健性。
对于独立(非配对)两组样本的比较,应使用曼-惠特尼U检验(Mann-Whitney U Test,亦称 Wilcoxon Rank-Sum Test),而非符号秩检验。
应用场景与注意事项
威尔科克森符号秩检验广泛应用于生物统计学、心理学、经济学和医学研究等领域中的配对设计实验,例如:同一组受试者在干预前后的测量值对比、两种不同测量方法在同一批样本上的结果比较、以及匹配组设计中的配对比较。
使用该检验时需注意:第一,虽不要求正态性,但要求差值分布大致对称——若分布严重偏斜,符号秩检验的功效会下降,此时可考虑符号检验。第二,样本量过小()时检验功效极为有限,且无法在通常的显著性水平下拒绝原假设。第三,存在大量结时检验的精确性会受影响,应优先使用带结校正的版本或精确条件分布。
威尔科克森符号秩检验以其简洁的假设条件和良好的稳健性,成为非参数统计工具箱中最基础也最有力的工具之一,在数据分析实践中具有不可替代的地位。