ARTICLE

随机实验

随机实验 (Randomized Experiment) 随机实验 (Randomized Experiment),亦称随机对照试验 (Randomized Controlled Trial, RCT),是因果推断的"金标准"方法。其核心特征是通过随机化机制将实验单元分配到处理组和控制组,从而在期望意义上消除所有可观测和不可观测的混杂变量的影响,使处理效应的

浏览 6 更新 2025-10-26

随机实验 (Randomized Experiment)

随机实验 (Randomized Experiment),亦称随机对照试验 (Randomized Controlled Trial, RCT),是因果推断的"金标准"方法。其核心特征是通过随机化机制将实验单元分配到处理组和控制组,从而在期望意义上消除所有可观测和不可观测的混杂变量的影响,使处理效应的估计具有无偏性和一致性。

基本原理

随机实验的思想基础植根于潜在结果框架 (Rubin Causal Model)。令 Yi(1)Y_i(1) 为个体 ii 接受处理时的潜在结果,Yi(0)Y_i(0) 为其未接受处理时的潜在结果。个体处理效应为 τi=Yi(1)Yi(0)\tau_i = Y_i(1) - Y_i(0),然而每个个体在同一时间只能处于一种状态——这是因果推断的基本难题。

随机化解决了上述难题:当处理分配 DiD_i 独立于潜在结果时,即 (Yi(1),Yi(0)) ⁣ ⁣ ⁣Di(Y_i(1), Y_i(0)) \perp\!\!\!\perp D_i平均处理效应 (Average Treatment Effect, ATE) 可通过处理组均值与控制组均值之差一致估计:

ATE=E[Yi(1)Yi(0)]=E[YiDi=1]E[YiDi=0]ATE = E[Y_i(1) - Y_i(0)] = E[Y_i \mid D_i = 1] - E[Y_i \mid D_i = 0]

历史渊源

随机实验的方法论根基可追溯至英国统计学家 Ronald A. Fisher。他在 1925 年出版的《研究工作的统计方法》(Statistical Methods for Research Workers) 中系统阐述了随机化和重复原则。Fisher 在 Rothamsted 农业实验站的工作表明,通过随机分配不同肥料处理到地块,可以消除土壤肥力差异带来的混淆效应。

在经济学领域,随机实验的大规模应用始于 20 世纪 60 年代的 New Jersey 负所得税实验,其后 RAND Health Insurance Experiment (1974–1982) 和 PROGRESA (1997) 等里程碑式研究极大推动了发展经济学和公共政策评估的实证革命。

常见类型

完全随机化设计 (Completely Randomized Design):将样本完全随机地分配到各处理组,适用于样本量大且实验单元同质的情况。其分析简便,可使用ANOVA或 t 检验。

分层随机化 (Stratified Randomization):先按关键协变量(如性别、年龄、收入)将样本分为若干层,然后在每层内进行随机分配,确保处理组与对照组在关键特征上均衡。分层随机化降低了组间在协变量上的机会不平衡,提高了估计精度。

区组随机化 (Block Randomization):将实验单元按时间、地理或批次等特征分为区组,在每一区组内随机分配处理,常用于医学多中心试验和田野实验。

集群随机化 (Cluster Randomization):以群体(如学校、村庄、医院)为随机化单位而非个体,适用于干预具有溢出效应或个体随机化不可行的场景。其缺点是统计效率低于个体随机化,分析需考虑组内相关系数 (ICC)。

内部效度威胁

尽管随机实验在理论上具有优越的因果识别能力,实践中仍面临多重威胁:

非遵守 (Non-compliance):部分受试者未按分配接受处理(如控制组自行获取干预,或处理组成员拒绝接受)。此时估计的是意向处理效应 (ITT),而处理组平均处理效应 (TOT 或 LATE) 需借助工具变量方法处理。

损耗 (Attrition):实验过程中受试者因各种原因退出,若退出与处理状态或潜在结果相关,则破坏随机化的平衡。经济学田野实验中典型的损耗包括企业倒闭、居民搬迁和拒绝继续参与。

霍桑效应 (Hawthorne Effect):受试者因意识到自己被观察而改变行为,使估计的处理效应无法推广至非实验环境。

溢出效应 (Spillover Effect):控制组成员通过社交网络、市场互动或信息传播受到处理的间接影响,导致 SUTVA (Stable Unit Treatment Value Assumption) 假设被违反。

经济学中的角色与局限

随机实验在发展经济学、劳动经济学、健康经济学和行为经济学中发挥了革命性作用。例如,Miguel 和 Kremer 关于肯尼亚学校的随机实验揭示了教科书对学生成绩的影响有限,而寄生虫药物治疗对出勤率有显著正面效应。田野实验 在经济学的应用已从政策评估拓展到市场设计、企业管理等多元领域。

然而,随机实验在经济学中也有显著局限:一是外部有效性——实验室结论能否推广至现实世界?二是伦理约束——随机拒绝某些群体获得潜在有益的政策干预是否正当?三是成本约束——大型田野实验的经费和时间投入巨大。四是宏观不可实验性——无法对货币政策、汇率制度和贸易协定等宏观变量进行随机化。这些局限促使计量经济学家发展准实验方法(如断点回归设计双重差分工具变量法)作为替代或补充策略。

总之,随机实验是因果推断方法谱系中的校准基准,但在社会科学的运用必须与理论逻辑、制度理解和多种识别策略相结合,方能生成既内部有效又外部可推广的科学知识。