ARTICLE
Dependent Samples
相依样本 (Dependent Samples) 相依样本 (Dependent Samples),也称为配对样本 (Paired Samples) 或匹配样本 (Matched Samples),是统计推断中的一种数据收集与比较结构。在相依样本设计中,两个数据集中的观测值不是相互独立的,而是存在一一对应的配对关系——每个样本点在两个条件下各贡献一次观测,或
相依样本 (Dependent Samples)
相依样本 (Dependent Samples),也称为配对样本 (Paired Samples) 或匹配样本 (Matched Samples),是统计推断中的一种数据收集与比较结构。在相依样本设计中,两个数据集中的观测值不是相互独立的,而是存在一一对应的配对关系——每个样本点在两个条件下各贡献一次观测,或两个受试者因某种关联因素而被组合在一起。与之相对的概念是独立样本 (Independent Samples),后者要求两组观测来自完全无关的总体或受试者。
相依样本的核心设计理念在于控制潜在的混淆变量。通过将受试者或实验单元在某种基准条件下进行配对,研究者可以有效消除个体间固有差异对结果的影响,从而提取出"处理效应"或"条件差异"的纯净信号。
常见配对形式
- 重复测量 (Repeated Measures):同一组受试者在不同时间点或不同条件下被观测两次。典型场景包括用药前后的血压测量、训练前后的成绩测试、政策实施前后的经济指标变化。这种设计在面板数据分析中也称为"个体内比较"。
- 自然配对 (Natural Pairs):利用天然的对偶关系进行配对,如双胞胎研究(同卵双胞胎分别接受不同处理)、夫妻双方的经济决策比较、同一对眼睛的左右眼、同一台机器的两个传感器读数等。
- 人工匹配 (Artificial Matching):研究者依据关键协变量(如年龄、性别、收入水平、教育程度)将处理组和对照组中的受试者逐一匹配。在倾向得分匹配中,匹配过程通过估计倾向得分来实现,广泛用于因果推断和观测性研究。
假设检验框架
在相依样本设定下,统计分析的核心思路是将配对比较问题转化为单样本问题:计算每对观测值的差值 (或 ),然后对差值序列 的总体均值 进行推断。
配对 t 检验 (Paired t-test)
配对 t 检验是最常用的相依样本均值比较方法,其假设前提为:
- 差值 独立同分布
- 差值来自(近似)正态总体,或在样本量足够大时依赖中心极限定理
检验统计量为:
其中 为差值的样本均值, 为差值的样本标准差。在零假设 下,该统计量服从自由度为 的 分布。
非参数替代:Wilcoxon 符号秩检验
当正态性假设不成立时,可使用 Wilcoxon 符号秩检验 (Wilcoxon Signed-Rank Test) 作为非参数替代。该检验基于差值绝对值的排序而非原始数值,对分布肥尾或存在离群值的情形更为稳健。
与独立样本的比较
- 统计功效:相依样本通常具有更高的统计功效。原因在于配对差分剔除了个体间变异这一噪声来源,使误差方差大幅减小。与独立样本 t 检验相比,配对检验的方差仅反映差值内部的变异性,而非两个独立组各自的变异性之和。
- 自由度:配对 t 检验的自由度为 ( 为配对数),而独立样本 t 检验的自由度为 。在相同总观测数下,配对设计牺牲了一部分自由度,但通常方差缩减的收益远大于自由度损失的成本。
- 适用条件:相依样本只有在配对变量与结果变量之间存在较强正相关时才优于独立样本。若配对是任意或无关的,配对设计反而可能因自由度的无谓损失而降低检验功效。
经济学与金融学应用
- 事件研究 (Event Study):比较同一家公司或同一类资产在事件(如政策公告、盈利发布)前后收益率的差异,核心统计检验即为配对 t 检验,检验事件窗口内的超额收益均值是否显著异于零。
- 双重差分法:本质上是对处理前后变化量在处理组和对照组之间再做一次独立比较,但其内部第一步(前后比较)天然涉及相依样本的思想。配对设计的逻辑是双重差分方法的方法论基础之一。
- 匹配估计量:在处理效应估计中,匹配方法(包括倾向得分匹配、马氏距离匹配)将处理个体与一个或多个控制个体配对,随后对配对差异进行平均。相依样本的推断理论直接适用于匹配后样本的统计检验。
常见误区
- 误用独立样本检验:对配对数据使用独立样本 t 检验会导致标准误显著增大、检验功效严重下降,可能错过真实存在的效应。
- 忽视配对的正相关性:配对设计的有效性依赖于配对变量与结果变量之间的正相关。若配对后的观测值之间实为负相关,配对分析可能产生比独立分析更差的效果。
- 差值分布的正态性:配对 t 检验要求差值满足正态性,而非原始观测值各自正态。许多实践中,即使原始数据严重偏态,差值也可能近似正态。