ARTICLE
因果
因果 (Causality) 因果是统计学、计量经济学和科学哲学中的核心概念,指一个变量(原因)对另一个变量(结果)所产生的真实、方向性的影响。与仅描述变量间统计关联的相关关系不同,因果关系回答的是反事实问题:"如果原因发生变化,结果会发生什么?" 确立因果关系是政策评估、医学研究和经济分析的终极目标。 相关不等于因果 区分相关与因果是实证研究中最基本的挑战
因果 (Causality)
因果是统计学、计量经济学和科学哲学中的核心概念,指一个变量(原因)对另一个变量(结果)所产生的真实、方向性的影响。与仅描述变量间统计关联的相关关系不同,因果关系回答的是反事实问题:"如果原因发生变化,结果会发生什么?" 确立因果关系是政策评估、医学研究和经济分析的终极目标。
相关不等于因果
区分相关与因果是实证研究中最基本的挑战。两个变量可能表现出强烈的统计相关性,但这种相关性可能来自:
- 直接因果: 确实影响 。
- 反向因果 (Reverse Causality): 影响 ,而非反之。
- 遗漏变量偏误 (Omitted Variable Bias):存在一个未观测到的第三个变量 同时影响 和 ,导致二者呈现虚假相关。
- 选择偏误 (Selection Bias):样本并非随机抽取,导致 与 的关联被系统性扭曲。
- 同时性偏误 (Simultaneity Bias): 与 相互决定,如价格与数量的关系。
经典的例子包括:冰激凌销量与溺水死亡人数正相关(共同受天气炎热影响);教育年限与收入正相关(可能存在能力偏误)。
潜在结果框架
鲁宾因果模型 (Rubin Causal Model, RCM),也称潜在结果框架,是现代因果推断的理论基石。对于每个个体 和二元处理变量 ,定义两个潜在结果:
- :个体 接受处理时的结果。
- :个体 未接受处理时的结果。
个体处理效应定义为 。然而,这是因果推断的根本问题 (Fundamental Problem of Causal Inference):对于任何一个体,我们只能观测到其中一个潜在结果,而另一个永远是反事实的。观测到的结果可写为:
由于无法直接观测个体处理效应,研究者转而估计总体的平均处理效应 (Average Treatment Effect, ATE):
或处理组的平均处理效应 (Average Treatment Effect on the Treated, ATT):
识别策略
要使 可识别,需要满足特定的识别假设。不同的研究设计对应不同的识别策略:
- 随机对照试验 (RCT):通过随机分配处理,确保 ,即处理与潜在结果独立。此时简单均值差 即为 ATE 的一致估计。RCT 被视为因果推断的金标准。
- 工具变量 (Instrumental Variables, IV):当处理 内生时,引入一个与处理相关但与潜在结果无关的工具变量 。两阶段最小二乘 (2SLS) 估计局部平均处理效应 (LATE),即仅对那些因 改变而改变处理状态的"依从者" (compliers) 的处理效应。
- 双重差分 (Difference-in-Differences, DiD):利用面板数据,比较处理组和对照组在政策前后结果变化的差异。关键假设是平行趋势假设:若无政策干预,两组的结果本会以相同趋势变化。
- 断点回归 (Regression Discontinuity Design, RDD):当处理分配由一个连续变量(驱动变量)是否超过某阈值决定时,在阈值附近,处理近似于随机分配,可识别局部因果效应。
- 匹配方法 (Matching):假设给定可观测协变量 后,处理与潜在结果独立(条件独立假设, CIA)。通过倾向得分匹配 (Propensity Score Matching) 等方法,为每个处理个体匹配相似的对照个体。
有向无环图与 do-演算
Judea Pearl 提出的结构因果模型 (Structural Causal Model, SCM) 和有向无环图 (Directed Acyclic Graph, DAG) 提供了另一种表达因果关系的语言。DAG 用节点表示变量,用有向边表示直接的因果关系。通过 -演算,可以在图形结构中形式化干预操作 ,即强制设定 取某个值,并推导在此干预下 的分布 。后门准则 (Backdoor Criterion) 和前门准则 (Frontdoor Criterion) 为判断何时可以通过观测数据识别因果效应提供了图形化判据。
格兰杰因果
在时间序列分析中,格兰杰因果 (Granger Causality) 是一种基于预测能力的因果概念:如果 的过去值有助于预测 的未来值(在已控制 自身过去值的前提下),则称 是 的格兰杰原因。需要注意的是,格兰杰因果不等于真正的结构因果:它捕捉的是时间上的预测关系,而非反事实意义上的因果机制。
经济学中的应用
因果推断方法在经济学中应用广泛:劳动经济学使用 DiD 和 IV 研究教育和培训的回报;发展经济学依赖 RCT 评估扶贫项目的效果;健康经济学利用 RDD 研究医保政策的影响。近年来,"可信度革命" (Credibility Revolution) 强调研究设计在因果识别中的优先性,推动了经济学从依赖结构性假设转向更加透明的准实验方法。
因果关系的建立需要理论、研究设计和统计方法的有机结合,是现代实证科学中最具挑战性也最为核心的任务之一。