ARTICLE
实验研究
实验研究 (Experimental Research) 实验研究是指通过人为控制或随机分配处理(treatment)来识别因果效应的一种经验研究方法。与观测性研究依赖自然变异不同,实验研究的核心优势在于通过随机化(randomization)消除选择偏误,实现对因果推断的内部有效性保障。实验研究在经济学中的应用自20世纪后期迅速发展,涵盖发展经济学、劳动经
实验研究 (Experimental Research)
实验研究是指通过人为控制或随机分配处理(treatment)来识别因果效应的一种经验研究方法。与观测性研究依赖自然变异不同,实验研究的核心优势在于通过随机化(randomization)消除选择偏误,实现对因果推断的内部有效性保障。实验研究在经济学中的应用自20世纪后期迅速发展,涵盖发展经济学、劳动经济学、行为经济学及公共经济学等广泛领域。2019年,Abhijit Banerjee、Esther Duflo和Michael Kremer因"在减轻全球贫困方面的实验性方法"获得诺贝尔经济学奖,标志着实验研究在经济学中的主流地位。
实验的主要类型
根据控制程度和实验环境,经济学中的实验研究可大致分为三类:
实验室实验(Lab Experiment):在受控的实验室环境中进行,受试者通常为学生志愿者,实验者可以精确操纵感兴趣的变量并观察行为反应。实验室实验的最大优势在于内部有效性极高——研究者能够排除无关因素的干扰,精确识别变量间的因果关系。例如,在行为博弈实验中,研究者随机分配不同规则或信息条件,测量参与者的策略选择。其局限在于外部有效性:实验室环境的人工性可能导致结论难以推广到真实经济场景。
田野实验(Field Experiment):在真实经济环境中进行,参与者通常不知道自己正在参与实验。研究者仍进行随机化处理分配,但保留了环境的自然性。田野实验兼顾了内部有效性和外部有效性,是经济学实证研究中增长最快的实验类型。典型例子包括随机对照试验(RCT):在教育研究中随机选择部分学校接受新教材(处理组),其余学校维持原教材(对照组),比较两组学生的学习成绩差异。RCT被视为因果推断的"黄金标准"。
自然实验(Natural Experiment):严格来说不属于真正的"实验",因其处理分配不由研究者操控,而是由自然事件、政策变化或制度特征决定。然而,若处理分配满足可近似为随机的条件,研究者可利用类似实验设计的分析方法,如工具变量法、双重差分法(DID)或断点回归设计(RDD),来识别因果效应。John Snow在1854年伦敦霍乱疫情中利用自来水公司的供水区域差异推断水源与霍乱的关系,便是自然实验的经典先驱。Angrist和Krueger(1991)利用出生季度对义务教育年限的"随机"影响估计教育回报率,是现代自然实验的典范。
随机化与平均处理效应
实验研究的统计基础建立在鲁宾因果模型(Rubin Causal Model)之上。每个个体 存在两个潜在结果: 在处理状态下的结果和 在控制状态下的结果。个体层面的因果效应为 ,但由于无法同时观察到两个潜在结果(因果推断的基本问题),研究者转而估计总体层面的平均处理效应(Average Treatment Effect, ATE):
随机化确保处理分配 独立于潜在结果:。在此条件下,处理组与控制组结果的均值差即为ATE的无偏估计:
当研究者关心的是实际接受处理者的效应时,可估计处理意向效应(Intent-to-Treat, ITT)和局部平均处理效应(LATE)。
实验设计的核心挑战
内部有效性的威胁主要包括:未完全依从(non-compliance)——受试者未按分配接受处理;损耗(attrition)——参与者在实验中退出导致样本选择偏误;溢出效应(spillover)或SUTVA违反——处理组的效果"溢出"到对照组;霍桑效应(Hawthorne effect)——受试者因知道自己被观察而改变行为。
外部有效性的挑战在于:实验结果能否推广到其他人群、其他环境或其他干预方式?小规模实验的效应在推广到大规模政策时可能发生显著变化,这涉及一般均衡效应与局部处理效应的差异。
伦理考量是实验研究不可回避的维度。随机分配处理意味着有意对对照组"不给予"潜在有益的干预,这在医学和减贫实验中尤其敏感。研究者需在科学价值与受试者权利之间谨慎权衡,通常遵循伦理委员会的审查与知情同意原则。
经济学中的应用前沿
实验研究已在经济学中形成丰富的方法论体系。在发展经济学中,J-PAL(Abdul Latif Jameel Poverty Action Lab)通过大规模RCT评估教育、健康、信贷等扶贫干预的效果。在行为经济学中,实验室实验揭示了前景理论、框架效应、社会偏好等偏离完全理性的行为规律。在劳动经济学中,实地实验用于测试招聘中的歧视、最低工资的就业效应等。公共经济学中,实验方法被广泛应用于税收遵从、投票行为、公共品供给机制的设计。
近年来,随着数字技术发展,线上实验(online experiment)和A/B测试成为平台经济研究的重要工具。同时,实验与结构估计的结合——通过实验数据校准理论模型的参数——代表了实验研究的前沿方向,有助于弥补实验内部有效性与理论一般性之间的鸿沟。