# 威尔科克森符号秩检验 (Wilcoxon Signed-Rank Test)
威尔科克森符号秩检验 (Wilcoxon Signed-Rank Test) 是一种重要的 {{{非参数统计}}} 方法,用于检验单一总体的{{{中位数}}}是否等于某个特定值,或者更常见地,用于比较两组成对或匹配样本的中位数是否存在显著差异。它被认为是{{{配对t检验}}} (Paired t-test) 的非参数对应物,当配对差异数据不满足{{{正态分布}}}假设时,此检验方法尤为适用。
该检验由弗兰克·威尔科克森 (Frank Wilcoxon) 于1945年提出,其巧妙之处在于它不仅考虑了差异值的符号(正或负),还通过对其绝对值进行排序来兼顾了差异的相对大小(即{{{秩}}}),因此比仅考虑符号的{{{符号检验}}} (Sign Test) 具有更高的{{{统计功效}}} (Statistical Power)。
## 检验的原理与适用条件
威尔科克森符号秩检验的核心思想是:如果{{{原假设}}} ($H_0$) 成立(即配对样本间无差异,或总体中位数为零),那么来自正差异的秩和与来自负差异的秩和应该大致相等。如果其中一个秩和远大于另一个,则提供了反对原假设的证据。
适用条件与假设:
1. 数据配对: 样本数据必须是成对的。这通常来自于重复测量(如“前-后”测设计)、匹配对(如根据年龄、性别等因素匹配的两个体)或一个样本与一个已知中位数的比较。 2. 测量尺度: 数据至少应为{{{有序尺度}}} (Ordinal Scale),但通常为{{{等距尺度}}} (Interval Scale) 或{{{等比尺度}}} (Ratio Scale),以便计算差异。 3. 差异的对称分布: 这是本检验最关键的假设。它不要求差异数据服从正态分布,但要求其分布是对称的。也就是说,差异值在其{{{中位数}}}周围对称分布。 4. 独立性: 各个数据对 $(X_i, Y_i)$ 之间应相互独立。
## 检验的步骤
执行威尔科克森符号秩检验的步骤如下,假设我们有 $n$ 个配对样本 $(X_1, Y_1), (X_2, Y_2), \ldots, (X_n, Y_n)$。
1. 计算差异值: 对每一对观察值,计算其差异 $D_i = X_i - Y_i$。在单样本情况下,差异为 $D_i = X_i - M_0$,其中 $M_0$ 是原假设中位数。
2. 处理零差异和关系(Ties): * 零差异: 剔除所有 $D_i = 0$ 的数据对,并将样本量 $n$ 更新为剩余数据对的数量。 * 关系(Ties in Ranks): 如果存在绝对值相同的差异,则为它们分配平均秩次。例如,如果第3、4、5小的绝对差异值相同,则它们的秩均为 $(3+4+5)/3 = 4$。
3. 计算绝对值并排序: 计算每个非零差异的绝对值 $|D_i|$,然后将这些绝对值从最小到最大进行排序,并分配秩次 $R_i$。最小的 $|D_i|$ 秩为1,次之的秩为2,以此类推。
4. 为秩次附加符号: 将原始差异 $D_i$ 的符号(正或负)附加到对应的秩次 $R_i$ 上。这样,我们就得到了一组带符号的秩。
5. 计算检验统计量: * 计算所有正秩之和,记为 $W^+$。 * 计算所有负秩的绝对值之和,记为 $W^-$。 * 检验统计量 $W$ 通常取 $W^+$ 和 $W^-$ 中较小的一个,即 $W = \min(W^+, W^-)$。
自检公式: $W^+ + W^- = \frac{n(n+1)}{2}$,这是前 $n$ 个正整数之和。这个公式可以用来检查计算是否正确。
## 假设检验与决策
1. 设立假设:
* {{{原假设}}} ($H_0$): 配对差异的中位数为0。 * {{{备择假设}}} ($H_1$): * 双尾检验:配对差异的中位数不为0。 * 左尾检验:配对差异的中位数小于0。 * 右尾检验:配对差异的中位数大于0。
2. 决策规则:
* 小样本情况 (n ≤ 30): 将计算出的检验统计量 $W$ 与在相应显著性水平 $\alpha$ 下的威尔科克森符号秩检验临界值表中的临界值 $W_{crit}$ 进行比较。 * 如果 $W \le W_{crit}$,则拒绝原假设 $H_0$。这意味着样本间的差异是统计显著的。 * 如果 $W > W_{crit}$,则不拒绝原假设 $H_0$。
* 大样本情况 (n > 30): 当样本量 $n$ 较大时,检验统计量 $W$ 的抽样分布近似于{{{正态分布}}}。此时,我们可以计算一个 $Z$ 分数并进行决策。其均值和标准差为: * 均值:$\mu_W = \frac{n(n+1)}{4}$ * 标准差:$\sigma_W = \sqrt{\frac{n(n+1)(2n+1)}{24}}$ * 注意: 如果存在关系(Ties),则标准差的计算需要进行调整,公式会更复杂。
$Z$ 统计量的计算公式为(通常使用{{{连续性校正}}}以提高近似精度): $$ Z = \frac{W - \mu_W \pm 0.5}{\sigma_W} $$ 其中,如果 $W > \mu_W$,则分子为 $W - \mu_W - 0.5$;如果 $W < \mu_W$,则分子为 $W - \mu_W + 0.5$。连续性校正的目的是使离散分布更好地逼近连续的正态分布。
然后,将计算出的 $Z$ 值与标准正态分布的临界值(例如,在 $\alpha = 0.05$ 的双尾检验中,临界值为 $\pm1.96$)进行比较,或者直接计算{{{p值}}}。
## 示例
假设我们想检验一种新药是否能有效降低患者的收缩压。我们测量了8位患者服药前后的收缩压。数据如下:
| 患者 | 服药前 (X) | 服药后 (Y) | 差异 (D=X-Y) | |:---:|:----------:|:----------:|:--------------:| | 1 | 145 | 135 | 10 | | 2 | 152 | 148 | 4 | | 3 | 160 | 162 | -2 | | 4 | 138 | 130 | 8 | | 5 | 148 | 141 | 7 | | 6 | 155 | 155 | 0 | | 7 | 163 | 150 | 13 | | 8 | 149 | 142 | 7 |
步骤: 1. 计算差异 (D): 已在上表列出。 2. 处理零差异: 患者6的差异为0,剔除此对数据。有效样本量 $n = 7$。 3. 计算绝对值并排序: * 非零差异的绝对值:$|10|, |4|, |-2|, |8|, |7|, |13|, |7|$ * 排序:$2, 4, 7, 7, 8, 10, 13$ 4. 分配秩次(处理关系): * $|-2|$ 的秩是1。 * $|4|$ 的秩是2。 * 两个 $|7|$ 占据了第3和第4位,因此它们的秩都是 $(3+4)/2 = 3.5$。 * $|8|$ 的秩是5。 * $|10|$ 的秩是6。 * $|13|$ 的秩是7。 * 排序后的秩:$1, 2, 3.5, 3.5, 5, 6, 7$ 5. 附加符号并计算 $W^+$ 和 $W^-$: * 负秩(来自 D = -2):-1 * 正秩(来自 D = 10, 4, 8, 7, 13, 7):$6, 2, 5, 3.5, 7, 3.5$ * $W^+ = 6 + 2 + 5 + 3.5 + 7 + 3.5 = 27$ * $W^- = 1$ 6. 确定检验统计量$W$: * $W = \min(W^+, W^-) = 1$。 * 检查:$W^+ + W^- = 27 + 1 = 28$。理论值 $\frac{n(n+1)}{2} = \frac{7(8)}{2} = 28$,计算正确。
7. 决策: 假设我们进行 $\alpha = 0.05$ 的双尾检验。查阅 $n=7$ 时的威尔科克森符号秩检验临界值表,我们发现临界值 $W_{crit}$ 为2。 因为我们计算出的 $W = 1$ 小于临界值 $W_{crit} = 2$,所以我们拒绝原假设。结论是:该药物对降低患者的收缩压有显著效果。
## 与其他检验的比较
* 与{{{配对t检验}}}的比较: * 如果配对差异确定服从{{{正态分布}}},配对t检验的统计功效更高。 * 如果数据严重偏离正态分布,或存在{{{异常值}}},威尔科克森符号秩检验更为稳健和可靠。
* 与{{{符号检验}}}的比较: * 符号检验只关心差异是正还是负,完全忽略了差异的大小。 * 威尔科克森符号秩检验通过引入秩的概念,利用了更多信息,因此通常比符号检验更具统计功效。
* 与{{{曼-惠特尼U检验}}}的比较: * 这是一个常见的混淆点。威尔科克森符号秩检验用于配对或相关样本。 * {{{曼-惠特尼U检验}}}(有时也称作威尔科克森秩和检验)用于两个独立的、非配对的样本。必须根据{{{实验设计}}}来选择正确的检验方法。