ARTICLE

控制组

控制组 (Control Group) 控制组 (Control Group) 是实验设计与因果推断中最基础的概念之一,指在一个实验或准实验中未接受处理(treatment)或干预的那一组受试者。控制组的唯一功能是提供一个反事实基准(counterfactual baseline):在保持其他条件不变的前提下,度量若没有干预发生,结果变量会如何演化。将处理组

浏览 0 更新 2025-10-26

控制组 (Control Group)

控制组 (Control Group) 是实验设计与因果推断中最基础的概念之一,指在一个实验或准实验中未接受处理(treatment)或干预的那一组受试者。控制组的唯一功能是提供一个反事实基准(counterfactual baseline):在保持其他条件不变的前提下,度量若没有干预发生,结果变量会如何演化。将处理组的平均结果减去控制组的平均结果,所得差值即为处理的平均处理效应(Average Treatment Effect, ATE)。可以说,没有控制组就没有因果推断——这正是 Fisher 在罗瑟姆斯特德农业实验站奠定随机化原则时的核心洞见。

控制组在随机化实验中的角色

在经典的随机对照试验(Randomized Controlled Trial, RCT)中,受试者通过某种随机机制被分配到处理组或控制组。随机化的关键意义在于,它在大样本下消除了两组在可观测和不可观测特征上的系统性差异,使得处理前两组在期望意义上完全可比。设 Yi(1)Y_i(1)Yi(0)Y_i(0) 分别表示个体 ii 在接受与未接受处理时的潜在结果,Di{0,1}D_i \in \{0,1\} 为处理指示变量。随机化保证:

{Yi(1),Yi(0)} ⁣ ⁣ ⁣Di\{Y_i(1), Y_i(0)\} \perp\!\!\!\perp D_i

即潜在结果独立于处理分配。此时,观测到的组间均值差一致地估计 ATE:

E[YiDi=1]E[YiDi=0]=E[Yi(1)Yi(0)]\mathbb{E}[Y_i \mid D_i = 1] - \mathbb{E}[Y_i \mid D_i = 0] = \mathbb{E}[Y_i(1) - Y_i(0)]

控制组可以接受安慰剂(placebo)或不接受任何处理。当受试者知晓自身所属组别可能产生心理效应时,常采用双盲设计:受试者和实验实施者均不知分组情况,以排除主观预期对结果的污染。这类设计在发展经济学的田野实验(如 DufloBanerjee 关于教育干预的系列 RCT)和劳动经济学的负所得税实验中被广泛采用。

控制组在准实验设计中的拓展

在经济学中,严格的随机化实验常因伦理、成本或操作约束而不可行,研究者转而依赖准实验方法。此时控制组的定义需要更细致的论证。

双重差分法(Difference-in-Differences, DiD)中,控制组是未受政策影响的地区或群体。其核心识别假设不是随机分配,而是平行趋势假设:在处理发生前,处理组与控制组的结果变量遵循相同的时间趋势。设 t=0t=0t=1t=1 分别为处理前后两期,DiD 估计量为:

τ^DiD=(Yˉtreat,1Yˉtreat,0)(Yˉcontrol,1Yˉcontrol,0)\hat{\tau}_{\text{DiD}} = (\bar{Y}_{\text{treat},1} - \bar{Y}_{\text{treat},0}) - (\bar{Y}_{\text{control},1} - \bar{Y}_{\text{control},0})

该估计量剔除了两组共有的时间趋势,仅保留处理组在处理后独有的变化。Card 和 Krueger(1994)关于最低工资对就业影响的研究中,将新泽西州(提高最低工资)作为处理组,宾夕法尼亚州东部(未提高)作为控制组,是 DiD 方法论的经典应用。

断点回归设计(Regression Discontinuity Design, RDD)中,控制组是落在断点"错误"一侧的个体。例如,评估奖学金对学生学业表现的影响时,恰好低于分数线的学生构成控制组,恰好高于分数线的学生构成处理组。RDD 的识别策略依赖于一个局部连续性条件:在断点附近,个体特征(除处理状态外)平滑变化,控制组的结果变量在断点处的极限值即为反事实。

匹配方法(如倾向得分匹配)试图从观测数据中为每个处理组个体构造一个"统计孪生"作为控制。RosenbaumRubin(1983)证明,若满足条件独立假设(Conditional Independence Assumption, CIA),即给定可观测协变量 XiX_i 后潜在结果独立于处理分配,则可以用倾向得分 p(Xi)=Pr(Di=1Xi)p(X_i) = \Pr(D_i = 1 \mid X_i) 为基础构造加权控制组来一致估计 ATT(处理组的平均处理效应)。

控制组构造中的关键假设与威胁

控制组的有效性高度依赖于若干核心假设,违反这些假设将导致估计偏误。

稳定单元处理值假设(Stable Unit Treatment Value Assumption, SUTVA)要求一个个体的潜在结果不受其他个体处理状态的影响。当存在溢出效应(spillover)或一般均衡效应时,控制组被"污染",不再提供有效的反事实。例如,在评估教育补贴的实验中,若控制组所在地的学校因处理组学生转学而获得更多资源,控制组也间接受益。

选择性偏误是非实验数据中最基本的威胁。若处理组与控制组在未观测特征上存在系统性差异(如参与培训项目的人本身就业意愿更强),则直接比较两组均值将混淆处理效应与选择效应。Heckman 选择模型和工具变量法是应对此类问题的经典手段。

控制组的道德与操作困境也值得关注。在医学和新药实验中,对控制组拒绝潜在有效的治疗引发伦理争议,促成了适应性设计等待列表控制组(waitlist control)等方法,确保控制组最终也能获得处理。在发展经济学中,随机选择部分村庄接受扶贫干预而其他村庄仅作为对照,同样面临公平性质疑,但研究者通常承诺实验结束后将有效干预推广至控制组。

多重控制组与稳健性检验

现代实证研究中,研究者常采用多重控制组策略增强结论可信度。例如,考察某个州政策变革的效果时,不仅以邻近州为控制组,还以全国其他未改革的州作为替代控制组,检验结论是否随控制组选择而剧烈变化。若不同控制组给出的估计值方向一致、幅度相近,则可有力回应关于控制组"特殊性"的质疑。

另一种常见做法是安慰剂检验(placebo test):将处理时间前移到一个已知未发生任何干预的时期,或人为将控制组中的一部分标记为"伪处理组",观察是否出现显著的"效应"。若出现,则说明原始结果可能由控制组选择不当或未观测趋势驱动,而非真正的处理效应。在合成控制法(Synthetic Control Method)中,控制组被进一步一般化为多个未处理单元的加权组合,以最小化处理前结果轨迹的差异,从而构造比任何单一控制组更具说服力的反事实。

综上所述,控制组绝非实验设计中从属于处理组的"配角",而是因果推断逻辑链条中不可或缺的一环。从业者必须清醒意识到,估计的质量并不取决于方法的精巧程度,而取决于控制组究竟在多大程度上回答了那个反事实问题:若没有干预,会发生什么?