ARTICLE

控制组

控制组 (Control Group) 控制组 (Control Group) 是实验设计与因果推断中最基础的概念之一，指在一个实验或准实验中未接受处理（treatment）或干预的那一组受试者。控制组的唯一功能是提供一个反事实基准（counterfactual baseline）：在保持其他条件不变的前提下，度量若没有干预发生，结果变量会如何演化。将处理组

浏览 0 更新 2025-10-26

控制组 (Control Group)

控制组 (Control Group) 是实验设计与因果推断中最基础的概念之一，指在一个实验或准实验中未接受处理（treatment）或干预的那一组受试者。控制组的唯一功能是提供一个反事实基准（counterfactual baseline）：在保持其他条件不变的前提下，度量若没有干预发生，结果变量会如何演化。将处理组的平均结果减去控制组的平均结果，所得差值即为处理的平均处理效应（Average Treatment Effect, ATE）。可以说，没有控制组就没有因果推断——这正是 Fisher 在罗瑟姆斯特德农业实验站奠定随机化原则时的核心洞见。

控制组在随机化实验中的角色

在经典的随机对照试验（Randomized Controlled Trial, RCT）中，受试者通过某种随机机制被分配到处理组或控制组。随机化的关键意义在于，它在大样本下消除了两组在可观测和不可观测特征上的系统性差异，使得处理前两组在期望意义上完全可比。设 $Y_i(1)$ 和 $Y_i(0)$ 分别表示个体 $i$ 在接受与未接受处理时的潜在结果， $D_i \in \{0,1\}$ 为处理指示变量。随机化保证：

\{Y_i(1), Y_i(0)\} \perp\!\!\!\perp D_i

即潜在结果独立于处理分配。此时，观测到的组间均值差一致地估计 ATE：

\mathbb{E}[Y_i \mid D_i = 1] - \mathbb{E}[Y_i \mid D_i = 0] = \mathbb{E}[Y_i(1) - Y_i(0)]

控制组可以接受安慰剂（placebo）或不接受任何处理。当受试者知晓自身所属组别可能产生心理效应时，常采用双盲设计：受试者和实验实施者均不知分组情况，以排除主观预期对结果的污染。这类设计在发展经济学的田野实验（如 Duflo 和 Banerjee 关于教育干预的系列 RCT）和劳动经济学的负所得税实验中被广泛采用。

控制组在准实验设计中的拓展

在经济学中，严格的随机化实验常因伦理、成本或操作约束而不可行，研究者转而依赖准实验方法。此时控制组的定义需要更细致的论证。

双重差分法（Difference-in-Differences, DiD）中，控制组是未受政策影响的地区或群体。其核心识别假设不是随机分配，而是平行趋势假设：在处理发生前，处理组与控制组的结果变量遵循相同的时间趋势。设 $t=0$ 和 $t=1$ 分别为处理前后两期，DiD 估计量为：

\hat{\tau}_{\text{DiD}} = (\bar{Y}_{\text{treat},1} - \bar{Y}_{\text{treat},0}) - (\bar{Y}_{\text{control},1} - \bar{Y}_{\text{control},0})

该估计量剔除了两组共有的时间趋势，仅保留处理组在处理后独有的变化。Card 和 Krueger（1994）关于最低工资对就业影响的研究中，将新泽西州（提高最低工资）作为处理组，宾夕法尼亚州东部（未提高）作为控制组，是 DiD 方法论的经典应用。

断点回归设计（Regression Discontinuity Design, RDD）中，控制组是落在断点"错误"一侧的个体。例如，评估奖学金对学生学业表现的影响时，恰好低于分数线的学生构成控制组，恰好高于分数线的学生构成处理组。RDD 的识别策略依赖于一个局部连续性条件：在断点附近，个体特征（除处理状态外）平滑变化，控制组的结果变量在断点处的极限值即为反事实。

匹配方法（如倾向得分匹配）试图从观测数据中为每个处理组个体构造一个"统计孪生"作为控制。Rosenbaum 和 Rubin（1983）证明，若满足条件独立假设（Conditional Independence Assumption, CIA），即给定可观测协变量 $X_i$ 后潜在结果独立于处理分配，则可以用倾向得分 $p(X_i) = \Pr(D_i = 1 \mid X_i)$ 为基础构造加权控制组来一致估计 ATT（处理组的平均处理效应）。

控制组构造中的关键假设与威胁

控制组的有效性高度依赖于若干核心假设，违反这些假设将导致估计偏误。

稳定单元处理值假设（Stable Unit Treatment Value Assumption, SUTVA）要求一个个体的潜在结果不受其他个体处理状态的影响。当存在溢出效应（spillover）或一般均衡效应时，控制组被"污染"，不再提供有效的反事实。例如，在评估教育补贴的实验中，若控制组所在地的学校因处理组学生转学而获得更多资源，控制组也间接受益。

选择性偏误是非实验数据中最基本的威胁。若处理组与控制组在未观测特征上存在系统性差异（如参与培训项目的人本身就业意愿更强），则直接比较两组均值将混淆处理效应与选择效应。Heckman 选择模型和工具变量法是应对此类问题的经典手段。

控制组的道德与操作困境也值得关注。在医学和新药实验中，对控制组拒绝潜在有效的治疗引发伦理争议，促成了适应性设计和等待列表控制组（waitlist control）等方法，确保控制组最终也能获得处理。在发展经济学中，随机选择部分村庄接受扶贫干预而其他村庄仅作为对照，同样面临公平性质疑，但研究者通常承诺实验结束后将有效干预推广至控制组。

多重控制组与稳健性检验

现代实证研究中，研究者常采用多重控制组策略增强结论可信度。例如，考察某个州政策变革的效果时，不仅以邻近州为控制组，还以全国其他未改革的州作为替代控制组，检验结论是否随控制组选择而剧烈变化。若不同控制组给出的估计值方向一致、幅度相近，则可有力回应关于控制组"特殊性"的质疑。

另一种常见做法是安慰剂检验（placebo test）：将处理时间前移到一个已知未发生任何干预的时期，或人为将控制组中的一部分标记为"伪处理组"，观察是否出现显著的"效应"。若出现，则说明原始结果可能由控制组选择不当或未观测趋势驱动，而非真正的处理效应。在合成控制法（Synthetic Control Method）中，控制组被进一步一般化为多个未处理单元的加权组合，以最小化处理前结果轨迹的差异，从而构造比任何单一控制组更具说服力的反事实。

综上所述，控制组绝非实验设计中从属于处理组的"配角"，而是因果推断逻辑链条中不可或缺的一环。从业者必须清醒意识到，估计的质量并不取决于方法的精巧程度，而取决于控制组究竟在多大程度上回答了那个反事实问题：若没有干预，会发生什么？

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。