ARTICLE

对照组

对照组 (Control Group) 对照组 (Control Group) 是 实验设计、统计学 和 计量经济学 中最基础也最重要的方法论概念之一。它指在一项实验或准实验中不接受处理(treatment)的受试者群体,其核心作用是为处理组的观测结果提供一个反事实 (counterfactual) 的基准——若没有干预,处理组将会呈现怎样的状态。正是凭借对

浏览 3 更新 2026-07-11

对照组 (Control Group)

对照组 (Control Group) 是 实验设计统计学计量经济学 中最基础也最重要的方法论概念之一。它指在一项实验或准实验中不接受处理(treatment)的受试者群体,其核心作用是为处理组的观测结果提供一个反事实 (counterfactual) 的基准——若没有干预,处理组将会呈现怎样的状态。正是凭借对照组的存在,研究者才能将处理组的前后变化分解为"处理效应"与"时间趋势/混淆因素",从而实现对因果效应的识别。在 Rubin 因果模型 (Rubin Causal Model) 的框架下,对照组代表的是处理组在接受处理条件下的未处理潜在结果 Yi(0) Y_i(0) 的经验代理。

对照组的逻辑基础:反事实推理

对照组的方法论根基是 反事实因果框架。对于个体 i i ,因果效应定义为 τi=Yi(1)Yi(0) \tau_i = Y_i(1) - Y_i(0) ——同一主体在接受处理与未接受处理两种状态下的结果差异。然而,"一个人无法两次踏入同一条河流":我们永远只能观测到 Yi(1) Y_i(1) Yi(0) Y_i(0) 其中之一,而无法同时观测两者。这便是 Holland (1986) 所表述的"因果推断的基本问题" (Fundamental Problem of Causal Inference)。

对照组的解决方案是:通过构建一个在处理前与处理组统计等价的群体,用对照组观测到的平均结果 Yˉcontrol \bar{Y}_{\text{control}} 来近似处理组若未受处理的平均潜在结果 E[Y(0)T=1] E[Y(0) \mid T=1] 。当随机化 (randomization) 成功实施时,处理组与对照组在所有可观测及不可观测特征上均来自相同的总体分布,二者的唯一系统性差异仅在于是否接受了处理——此时组间结果的平均差异 YˉtreatYˉcontrol \bar{Y}_{\text{treat}} - \bar{Y}_{\text{control}} 即为平均处理效应 (ATE, Average Treatment Effect) 的无偏估计。

随机化:对照组有效性的基石

对照组的有效性几乎完全取决于处理组与对照组之间的可比性 (comparability)。随机化——将受试者以纯概率机制分配到各组——是保证可比性的黄金标准。其逻辑不是使每个个体都相同(那是不可能的),而是确保两组在概率意义上等价:任何混淆变量 X X 的分布 P(XT=1) P(X \mid T=1) P(XT=0) P(X \mid T=0) 在大样本下趋于一致。随机化因此消除了混淆偏差 (confounding bias) 和选择偏差 (selection bias) 的双重威胁。

实践中,随机化之后应进行平衡性检验 (Balance Check):比较两组在年龄、性别、基线测量值等预处理变量上的差异。若检验发现统计显著的系统性差异,则随机化可能失败,需要借助 回归调整倾向得分 等后验方法补救。

对照组的主要类型

根据研究设计和伦理约束,对照组可以采取多种形式,各有其适用场景与分析含义:

安慰剂对照组 (Placebo Control):对照组接受外表与真实处理相同但无活性成分的干预(如糖丸、假手术)。这是药物临床试验的标准配置,旨在分离出处理本身的药理效应(而非心理暗示或预期效应)。双盲设计 (double-blind) 要求受试者与实施者均不知晓分组,以消除主观偏倚。

阳性对照组 (Active Control):当对处于危险状态的受试者不予治疗在伦理上不可接受时,对照组接受一种已知有效的标准疗法而非安慰剂。此时研究问题从"新药是否优于无治疗"转变为"新药是否不劣于或优于现有标准疗法"。相应的统计检验框架从优越性检验 (superiority test) 转移至非劣效性检验 (non-inferiority test)。

等待名单对照组 (Wait-List Control):用于教育干预、心理治疗等不宜拒绝服务的场景。对照组被告知将在实验结束后接受同样的干预。此设计既满足了伦理约束,又提供了暂时的未处理基线;但需注意等待期间的预期效应和补偿行为可能污染对照数据。

历史对照组 (Historical Control):对照组数据来自既往研究、行政记录或文献,而非同期收集。此设计节省成本,但面临严重的时间混淆问题——诊疗标准、人口结构、数据质量随时间变化,可能将时间趋势误判为处理效应。仅当无同期对照可行且时间异质性可被充分建模时方可谨慎使用。

计量经济学中的对照组

计量经济学政策评估 中,对照组的概念超越了随机化实验的狭域,延伸至准实验设计 (Quasi-Experimental Design) 的广阔地带——因为经济学研究通常无法对个体、企业或国家进行随机化。

双重差分法 (Difference-in-Differences, DID) 是最典型的对照组应用:通过比较处理组前后变化与对照组前后变化的差异,DID 消除了两组共有的时间趋势,从而在"平行趋势假设"下识别因果效应。这里的对照组不是随机分配的,而是基于"在无干预时趋势平行"这一可部分验证的假设选取的。

合成控制法 (Synthetic Control Method) 则更进一步:当单个对照组单位无法充分代表处理组的反事实时,该方法从多个候选对照组中加权合成一个虚拟对照组,使其在预处理期的趋势和处理组尽可能接近。AbadieGardeazabal (2003) 对巴斯克地区恐怖主义经济影响的研究是该方法的经典案例。

断点回归 (Regression Discontinuity, RD) 中的对照组逻辑更为精细:对于依据某个连续变量 Ri R_i 超过阈值 c c 来决定是否接受处理的制度,在阈值附近极窄带内的未处理个体(Ri<c R_i < c )构成了处理个体的局部对照组——在极限意义上,这一对照组几乎像随机分配一样理想。

对照组失效的常见风险

尽管对照组在方法论层面无可替代,其实施面临多重威胁:

污染 (Contamination):对照组受试者以某种形式(间接接触、信息泄露、主动寻求)部分地接受了处理,使"未处理"的定义模糊化。这会缩小处理组-对照组差异,导致处理效应被低估。意向性分析 (ITT, Intention-to-Treat) 通过按初始分配而非实际接受状态进行比较来保守应对污染。

选择偏差:在非随机化设计中,个体是否进入对照组可能与其潜在结果相关。志愿者与拒绝参与者、早期采纳者与观望者之间存在系统性差异,这些差异可能与结果变量直接相关。Heckman 选择模型工具变量法 是应对选择偏差的主要计量工具。

霍桑效应 (Hawthorne Effect):知晓自己"正在被研究"这一事实本身可能改变对照组的行为,使得对照组的观测结果不再反映自然状态下的反事实。John Henry 效应 则表现为对照组因感到竞争压力而格外努力,致使处理效应被低估。

损耗偏差 (Attrition Bias):如果受试者在实验过程中退出,而退出的概率和处理状态及潜在结果相关(例如处理有效者留、处理无效者走),则剩余的对照组不再构成有效反事实。进行损耗率的组间比较和缺失数据的敏感性分析是标准应对策略。

伦理维度

对照组的使用——特别是安慰剂对照——始终处于方法论要求与医学伦理的张力之中。《赫尔辛基宣言》要求:在已有被证明有效的干预措施时,除非有令人信服的科学理由,否则不应使用安慰剂对照,因为剥夺受试者获得已知有效治疗的权利可能构成伤害。这一伦理约束推动了阳性对照、等待名单对照等替代设计的广泛应用,同时也催生了适应性设计 (adaptive design),允许根据中期数据调整分组比例,使更多受试者进入表现更优的组别。

在经济学和社会科学的政策评估中,对照组的伦理问题常表现为"为什么要给一些人而不给另一些人?"——当干预被视为有益的公共资源时,随机拒绝一部分人入组可能在政治上和法律上都难以正当化。渐次推广设计 (stepped-wedge design) 通过让所有单位最终都接受干预(仅时间先后随机)缓解了这一困境。

对照组从一个朴素的操作性工具——"找一组没被处理的人比较一下"——发展为支撑整个因果推断大厦的方法论基石,其演化过程本身也是科学方法从相关到因果推理深化的缩影。理解对照组,就是理解我们如何在一个不可重复的世界中逼近"如果……会怎样?"这一永恒的反事实追问。