ARTICLE
随机实验
随机实验 (Randomized Experiment) 随机实验 (Randomized Experiment),亦称随机对照试验 (Randomized Controlled Trial, RCT),是因果推断的"金标准"方法。其核心特征是通过随机化机制将实验单元分配到处理组和控制组,从而在期望意义上消除所有可观测和不可观测的混杂变量的影响,使处理效应的
随机实验 (Randomized Experiment)
随机实验 (Randomized Experiment),亦称随机对照试验 (Randomized Controlled Trial, RCT),是因果推断的"金标准"方法。其核心特征是通过随机化机制将实验单元分配到处理组和控制组,从而在期望意义上消除所有可观测和不可观测的混杂变量的影响,使处理效应的估计具有无偏性和一致性。
基本原理
随机实验的思想基础植根于潜在结果框架 (Rubin Causal Model)。令 为个体 接受处理时的潜在结果, 为其未接受处理时的潜在结果。个体处理效应为 ,然而每个个体在同一时间只能处于一种状态——这是因果推断的基本难题。
随机化解决了上述难题:当处理分配 独立于潜在结果时,即 ,平均处理效应 (Average Treatment Effect, ATE) 可通过处理组均值与控制组均值之差一致估计:
历史渊源
随机实验的方法论根基可追溯至英国统计学家 Ronald A. Fisher。他在 1925 年出版的《研究工作的统计方法》(Statistical Methods for Research Workers) 中系统阐述了随机化和重复原则。Fisher 在 Rothamsted 农业实验站的工作表明,通过随机分配不同肥料处理到地块,可以消除土壤肥力差异带来的混淆效应。
在经济学领域,随机实验的大规模应用始于 20 世纪 60 年代的 New Jersey 负所得税实验,其后 RAND Health Insurance Experiment (1974–1982) 和 PROGRESA (1997) 等里程碑式研究极大推动了发展经济学和公共政策评估的实证革命。
常见类型
完全随机化设计 (Completely Randomized Design):将样本完全随机地分配到各处理组,适用于样本量大且实验单元同质的情况。其分析简便,可使用ANOVA或 t 检验。
分层随机化 (Stratified Randomization):先按关键协变量(如性别、年龄、收入)将样本分为若干层,然后在每层内进行随机分配,确保处理组与对照组在关键特征上均衡。分层随机化降低了组间在协变量上的机会不平衡,提高了估计精度。
区组随机化 (Block Randomization):将实验单元按时间、地理或批次等特征分为区组,在每一区组内随机分配处理,常用于医学多中心试验和田野实验。
集群随机化 (Cluster Randomization):以群体(如学校、村庄、医院)为随机化单位而非个体,适用于干预具有溢出效应或个体随机化不可行的场景。其缺点是统计效率低于个体随机化,分析需考虑组内相关系数 (ICC)。
内部效度威胁
尽管随机实验在理论上具有优越的因果识别能力,实践中仍面临多重威胁:
非遵守 (Non-compliance):部分受试者未按分配接受处理(如控制组自行获取干预,或处理组成员拒绝接受)。此时估计的是意向处理效应 (ITT),而处理组平均处理效应 (TOT 或 LATE) 需借助工具变量方法处理。
损耗 (Attrition):实验过程中受试者因各种原因退出,若退出与处理状态或潜在结果相关,则破坏随机化的平衡。经济学田野实验中典型的损耗包括企业倒闭、居民搬迁和拒绝继续参与。
霍桑效应 (Hawthorne Effect):受试者因意识到自己被观察而改变行为,使估计的处理效应无法推广至非实验环境。
溢出效应 (Spillover Effect):控制组成员通过社交网络、市场互动或信息传播受到处理的间接影响,导致 SUTVA (Stable Unit Treatment Value Assumption) 假设被违反。
经济学中的角色与局限
随机实验在发展经济学、劳动经济学、健康经济学和行为经济学中发挥了革命性作用。例如,Miguel 和 Kremer 关于肯尼亚学校的随机实验揭示了教科书对学生成绩的影响有限,而寄生虫药物治疗对出勤率有显著正面效应。田野实验 在经济学的应用已从政策评估拓展到市场设计、企业管理等多元领域。
然而,随机实验在经济学中也有显著局限:一是外部有效性——实验室结论能否推广至现实世界?二是伦理约束——随机拒绝某些群体获得潜在有益的政策干预是否正当?三是成本约束——大型田野实验的经费和时间投入巨大。四是宏观不可实验性——无法对货币政策、汇率制度和贸易协定等宏观变量进行随机化。这些局限促使计量经济学家发展准实验方法(如断点回归设计、双重差分和工具变量法)作为替代或补充策略。
总之,随机实验是因果推断方法谱系中的校准基准,但在社会科学的运用必须与理论逻辑、制度理解和多种识别策略相结合,方能生成既内部有效又外部可推广的科学知识。