ARTICLE
控制组
控制组 (Control Group) 控制组 (Control Group) 是实验设计与因果推断中最基础的概念之一,指在一个实验或准实验中未接受处理(treatment)或干预的那一组受试者。控制组的唯一功能是提供一个反事实基准(counterfactual baseline):在保持其他条件不变的前提下,度量若没有干预发生,结果变量会如何演化。将处理组
控制组 (Control Group)
控制组 (Control Group) 是实验设计与因果推断中最基础的概念之一,指在一个实验或准实验中未接受处理(treatment)或干预的那一组受试者。控制组的唯一功能是提供一个反事实基准(counterfactual baseline):在保持其他条件不变的前提下,度量若没有干预发生,结果变量会如何演化。将处理组的平均结果减去控制组的平均结果,所得差值即为处理的平均处理效应(Average Treatment Effect, ATE)。可以说,没有控制组就没有因果推断——这正是 Fisher 在罗瑟姆斯特德农业实验站奠定随机化原则时的核心洞见。
控制组在随机化实验中的角色
在经典的随机对照试验(Randomized Controlled Trial, RCT)中,受试者通过某种随机机制被分配到处理组或控制组。随机化的关键意义在于,它在大样本下消除了两组在可观测和不可观测特征上的系统性差异,使得处理前两组在期望意义上完全可比。设 和 分别表示个体 在接受与未接受处理时的潜在结果, 为处理指示变量。随机化保证:
即潜在结果独立于处理分配。此时,观测到的组间均值差一致地估计 ATE:
控制组可以接受安慰剂(placebo)或不接受任何处理。当受试者知晓自身所属组别可能产生心理效应时,常采用双盲设计:受试者和实验实施者均不知分组情况,以排除主观预期对结果的污染。这类设计在发展经济学的田野实验(如 Duflo 和 Banerjee 关于教育干预的系列 RCT)和劳动经济学的负所得税实验中被广泛采用。
控制组在准实验设计中的拓展
在经济学中,严格的随机化实验常因伦理、成本或操作约束而不可行,研究者转而依赖准实验方法。此时控制组的定义需要更细致的论证。
双重差分法(Difference-in-Differences, DiD)中,控制组是未受政策影响的地区或群体。其核心识别假设不是随机分配,而是平行趋势假设:在处理发生前,处理组与控制组的结果变量遵循相同的时间趋势。设 和 分别为处理前后两期,DiD 估计量为:
该估计量剔除了两组共有的时间趋势,仅保留处理组在处理后独有的变化。Card 和 Krueger(1994)关于最低工资对就业影响的研究中,将新泽西州(提高最低工资)作为处理组,宾夕法尼亚州东部(未提高)作为控制组,是 DiD 方法论的经典应用。
断点回归设计(Regression Discontinuity Design, RDD)中,控制组是落在断点"错误"一侧的个体。例如,评估奖学金对学生学业表现的影响时,恰好低于分数线的学生构成控制组,恰好高于分数线的学生构成处理组。RDD 的识别策略依赖于一个局部连续性条件:在断点附近,个体特征(除处理状态外)平滑变化,控制组的结果变量在断点处的极限值即为反事实。
匹配方法(如倾向得分匹配)试图从观测数据中为每个处理组个体构造一个"统计孪生"作为控制。Rosenbaum 和 Rubin(1983)证明,若满足条件独立假设(Conditional Independence Assumption, CIA),即给定可观测协变量 后潜在结果独立于处理分配,则可以用倾向得分 为基础构造加权控制组来一致估计 ATT(处理组的平均处理效应)。
控制组构造中的关键假设与威胁
控制组的有效性高度依赖于若干核心假设,违反这些假设将导致估计偏误。
稳定单元处理值假设(Stable Unit Treatment Value Assumption, SUTVA)要求一个个体的潜在结果不受其他个体处理状态的影响。当存在溢出效应(spillover)或一般均衡效应时,控制组被"污染",不再提供有效的反事实。例如,在评估教育补贴的实验中,若控制组所在地的学校因处理组学生转学而获得更多资源,控制组也间接受益。
选择性偏误是非实验数据中最基本的威胁。若处理组与控制组在未观测特征上存在系统性差异(如参与培训项目的人本身就业意愿更强),则直接比较两组均值将混淆处理效应与选择效应。Heckman 选择模型和工具变量法是应对此类问题的经典手段。
控制组的道德与操作困境也值得关注。在医学和新药实验中,对控制组拒绝潜在有效的治疗引发伦理争议,促成了适应性设计和等待列表控制组(waitlist control)等方法,确保控制组最终也能获得处理。在发展经济学中,随机选择部分村庄接受扶贫干预而其他村庄仅作为对照,同样面临公平性质疑,但研究者通常承诺实验结束后将有效干预推广至控制组。
多重控制组与稳健性检验
现代实证研究中,研究者常采用多重控制组策略增强结论可信度。例如,考察某个州政策变革的效果时,不仅以邻近州为控制组,还以全国其他未改革的州作为替代控制组,检验结论是否随控制组选择而剧烈变化。若不同控制组给出的估计值方向一致、幅度相近,则可有力回应关于控制组"特殊性"的质疑。
另一种常见做法是安慰剂检验(placebo test):将处理时间前移到一个已知未发生任何干预的时期,或人为将控制组中的一部分标记为"伪处理组",观察是否出现显著的"效应"。若出现,则说明原始结果可能由控制组选择不当或未观测趋势驱动,而非真正的处理效应。在合成控制法(Synthetic Control Method)中,控制组被进一步一般化为多个未处理单元的加权组合,以最小化处理前结果轨迹的差异,从而构造比任何单一控制组更具说服力的反事实。
综上所述,控制组绝非实验设计中从属于处理组的"配角",而是因果推断逻辑链条中不可或缺的一环。从业者必须清醒意识到,估计的质量并不取决于方法的精巧程度,而取决于控制组究竟在多大程度上回答了那个反事实问题:若没有干预,会发生什么?