ARTICLE

Randomized Controlled Trial

随机对照试验 (Randomized Controlled Trial) 随机对照试验 (Randomized Controlled Trial, RCT) 是一种通过随机化分配 (random assignment) 将研究对象分为处理组 (treatment group) 与对照组 (control group),以估计某个干预 (interventio

浏览 0 更新 2025-10-26

随机对照试验 (Randomized Controlled Trial)

随机对照试验 (Randomized Controlled Trial, RCT) 是一种通过随机化分配 (random assignment) 将研究对象分为处理组 (treatment group) 与对照组 (control group),以估计某个干预 (intervention) 或政策因果效应的实验方法。RCT 被公认为因果推断 (causal inference) 的「金标准」(gold standard),因为它能最大限度地消除选择偏差 (selection bias) 与混杂因素 (confounding factors) 的影响,使处理组与对照组在可观测和不可观测特征上达到统计意义上的平衡。

历史渊源

RCT 的思想最早由统计学家 R. A. Fisher 在其 1935 年出版的 The Design of Experiments 中系统阐述,最初应用于农业田间试验。Fisher 论证了只有通过随机化,才能为实验误差提供无偏估计,从而奠定了现代实验设计的理论基础。20 世纪中叶,RCT 被引入临床医学,成为药物审批与疗效评估的法定标准。进入 21 世纪后,经济学家开始在社会科学领域大规模推行 RCT,其中最著名的推动者是 Abhijit BanerjeeEsther DufloMichael Kremer,他们因「用实验方法减轻全球贫困」的研究而获得 2019 年诺贝尔经济学奖。这一传统被称为 随机对照试验运动 (Randomista Movement),深刻改变了发展经济学的实证范式。

核心原理与估计框架

RCT 的因果识别建立在 潜在结果框架 (Potential Outcomes Framework) 之上,亦称 Rubin 因果模型 (Rubin Causal Model)。记个体 ii 的二元处理指示变量为 Di{0,1}D_i \in \{0, 1\},其中 Di=1D_i = 1 表示接受处理,Di=0D_i = 0 表示对照。每个个体存在两个潜在结果:Yi(1)Y_i(1) 为接受处理时的结果,Yi(0)Y_i(0) 为未接受处理时的结果。个体层面的因果效应定义为:

τi=Yi(1)Yi(0)\tau_i = Y_i(1) - Y_i(0)

由于同一个体无法同时处于两种状态(即缺失数据问题),个体因果效应不可直接观测。RCT 通过随机化使处理分配与潜在结果独立,即:

{Yi(1),Yi(0)}Di\{Y_i(1), Y_i(0)\} \perp D_i

在此条件下,处理组与对照组的均值之差一致估计 平均处理效应 (Average Treatment Effect, ATE):

τATE=E[Yi(1)Yi(0)]=E[YiDi=1]E[YiDi=0]\tau_{\text{ATE}} = \mathbb{E}[Y_i(1) - Y_i(0)] = \mathbb{E}[Y_i \mid D_i = 1] - \mathbb{E}[Y_i \mid D_i = 0]

计量经济学估计

最简单的 RCT 估计量是均值差,即:

τ^=YˉTYˉC\hat{\tau} = \bar{Y}_T - \bar{Y}_C

其中 YˉT\bar{Y}_TYˉC\bar{Y}_C 分别为处理组和对照组的样本均值。实际应用中更常用回归框架:

Yi=α+τDi+εiY_i = \alpha + \tau D_i + \varepsilon_i

通过 OLS 估计 τ\tau,在 RCT 设计下,τ^OLS\hat{\tau}_{\text{OLS}} 等价于均值差。加入基线协变量 XiX_i 可提高估计精度:

Yi=α+τDi+βXi+εiY_i = \alpha + \tau D_i + \beta X_i + \varepsilon_i

在随机化有效的条件下,DiD_iXiX_i 不相关,加入 XiX_i 不会导致 τ^\hat{\tau} 不一致,反而因降低残差方差而获得更小的标准误。

内部有效性与外部有效性

内部有效性 (Internal Validity) 指研究在自身样本范围内因果推断的正确性。RCT 因随机化确保了内部有效性的最高水平。威胁内部有效性的因素包括:不完全遵从 (imperfect compliance)、失访 (attrition)、溢出效应 (spillover effects) 和霍桑效应 (Hawthorne effect)。当存在不完全遵从时,研究者常转而估计 局部平均处理效应 (Local Average Treatment Effect, LATE),即基于随机分配作为工具变量的 工具变量法 (Instrumental Variables, IV)。

外部有效性 (External Validity) 指研究结论能否推广到其他人群、情境或时间。RCT 的外部有效性常受质疑:实验通常在小规模、特定地域中实施,其结论可能无法直接推广到更大范围。为此,许多研究采用 多中心试验 (multi-site trials) 或 系统性综述与荟萃分析 (systematic reviews and meta-analysis) 来增强外部有效性。

应用领域

在经济学中,RCT 广泛应用于以下领域:

  1. 发展经济学:评估教育干预(如教科书分发、奖学金)、健康干预(如驱虫、疫苗接种激励)、小额信贷等减贫政策的效果。经典案例包括 Kremer 等人在肯尼亚进行的驱虫实验和 Banerjee 等人在印度进行的教学改革实验。
  2. 劳动经济学:评估职业培训项目、最低工资政策的就业效应。
  3. 行为经济学:测试助推 (nudge) 策略对储蓄、缴费、纳税遵从的影响。
  4. 公共卫生经济学:评估医疗保险覆盖方案、健康信息宣传对个体行为的影响。

局限性与伦理考量

尽管 RCT 在识别因果效应方面具有无与伦比的优势,但也面临若干挑战:

  • 成本与时间:高质量的田野实验 (field experiment) 耗时长、费用高,尤其当需要大样本和长期追踪时。
  • 伦理问题:随机拒绝部分个体接受潜在有益的处理(如教育资源、医疗干预)可能引发伦理争议。研究者必须确保对照组接受的待遇不低于现行标准。
  • 一般均衡效应:RCT 通常估计局部处理效应,但大规模推广后可能出现价格调整、挤出效应等一般均衡反馈,使得局部估计无法预测全局效果。
  • 随机化失败:小样本时随机化未必保证协变量平衡。研究者通常通过平衡性检验 (balance test) 来验证随机化质量,并在必要时使用回归调整或匹配方法作为补救。

与其他因果推断方法的关系

当 RCT 不可行时,经济学家依赖 准实验方法 (quasi-experimental methods) 进行因果推断:

  • 工具变量法:当处理分配非随机但存在有效工具变量时使用。RCT 中的随机分配本身即是最理想的工具变量。
  • 双重差分法:利用处理组与对照组在政策实施前后的变化差异识别因果效应,依赖于平行趋势假设。
  • 断点回归:当处理分配基于某个连续变量的阈值时,利用断点附近的局部随机性进行识别。
  • 匹配方法:基于可观测变量为每个处理个体寻找匹配的对照个体,但无法消除不可观测因素的偏差。

RCT 之所以被视为因果推断的金标准,正是因为它通过随机化绕过了准实验方法中必须依赖的种种不可检验的识别假设。对计量经济学研究而言,理解 RCT 的设计逻辑与潜在局限,不仅有助于评估实验证据的质量,也能为在非实验环境下选择恰当的识别策略提供理论参照。