ARTICLE

因果

因果 (Causality) 因果是统计学、计量经济学和科学哲学中的核心概念,指一个变量(原因)对另一个变量(结果)所产生的真实、方向性的影响。与仅描述变量间统计关联的相关关系不同,因果关系回答的是反事实问题:"如果原因发生变化,结果会发生什么?" 确立因果关系是政策评估、医学研究和经济分析的终极目标。 相关不等于因果 区分相关与因果是实证研究中最基本的挑战

浏览 7 更新 2025-10-26

因果 (Causality)

因果是统计学、计量经济学和科学哲学中的核心概念,指一个变量(原因)对另一个变量(结果)所产生的真实、方向性的影响。与仅描述变量间统计关联的相关关系不同,因果关系回答的是反事实问题:"如果原因发生变化,结果会发生什么?" 确立因果关系是政策评估、医学研究和经济分析的终极目标。

相关不等于因果

区分相关与因果是实证研究中最基本的挑战。两个变量可能表现出强烈的统计相关性,但这种相关性可能来自:

  • 直接因果XX 确实影响 YY
  • 反向因果 (Reverse Causality)YY 影响 XX,而非反之。
  • 遗漏变量偏误 (Omitted Variable Bias):存在一个未观测到的第三个变量 ZZ 同时影响 XXYY,导致二者呈现虚假相关。
  • 选择偏误 (Selection Bias):样本并非随机抽取,导致 XXYY 的关联被系统性扭曲。
  • 同时性偏误 (Simultaneity Bias)XXYY 相互决定,如价格与数量的关系。

经典的例子包括:冰激凌销量与溺水死亡人数正相关(共同受天气炎热影响);教育年限与收入正相关(可能存在能力偏误)。

潜在结果框架

鲁宾因果模型 (Rubin Causal Model, RCM),也称潜在结果框架,是现代因果推断的理论基石。对于每个个体 ii 和二元处理变量 Di{0,1}D_i \in \{0, 1\},定义两个潜在结果:

  • Yi(1)Y_i(1):个体 ii 接受处理时的结果。
  • Yi(0)Y_i(0):个体 ii 未接受处理时的结果。

个体处理效应定义为 τi=Yi(1)Yi(0)\tau_i = Y_i(1) - Y_i(0)。然而,这是因果推断的根本问题 (Fundamental Problem of Causal Inference):对于任何一个体,我们只能观测到其中一个潜在结果,而另一个永远是反事实的。观测到的结果可写为:

Yi=DiYi(1)+(1Di)Yi(0)Y_i = D_i Y_i(1) + (1 - D_i) Y_i(0)

由于无法直接观测个体处理效应,研究者转而估计总体的平均处理效应 (Average Treatment Effect, ATE):

τATE=E[Yi(1)Yi(0)]\tau_{ATE} = \mathbb{E}[Y_i(1) - Y_i(0)]

或处理组的平均处理效应 (Average Treatment Effect on the Treated, ATT):

τATT=E[Yi(1)Yi(0)Di=1]\tau_{ATT} = \mathbb{E}[Y_i(1) - Y_i(0) \mid D_i = 1]

识别策略

要使 τATE\tau_{ATE} 可识别,需要满足特定的识别假设。不同的研究设计对应不同的识别策略:

  1. 随机对照试验 (RCT):通过随机分配处理,确保 Di ⁣ ⁣ ⁣(Yi(0),Yi(1))D_i \perp\!\!\!\perp (Y_i(0), Y_i(1)),即处理与潜在结果独立。此时简单均值差 E[YiDi=1]E[YiDi=0]\mathbb{E}[Y_i \mid D_i=1] - \mathbb{E}[Y_i \mid D_i=0] 即为 ATE 的一致估计。RCT 被视为因果推断的金标准
  2. 工具变量 (Instrumental Variables, IV):当处理 DiD_i 内生时,引入一个与处理相关但与潜在结果无关的工具变量 ZiZ_i。两阶段最小二乘 (2SLS) 估计局部平均处理效应 (LATE),即仅对那些因 ZiZ_i 改变而改变处理状态的"依从者" (compliers) 的处理效应。
  3. 双重差分 (Difference-in-Differences, DiD):利用面板数据,比较处理组和对照组在政策前后结果变化的差异。关键假设是平行趋势假设:若无政策干预,两组的结果本会以相同趋势变化。
  4. 断点回归 (Regression Discontinuity Design, RDD):当处理分配由一个连续变量(驱动变量)是否超过某阈值决定时,在阈值附近,处理近似于随机分配,可识别局部因果效应。
  5. 匹配方法 (Matching):假设给定可观测协变量 XiX_i 后,处理与潜在结果独立(条件独立假设, CIA)。通过倾向得分匹配 (Propensity Score Matching) 等方法,为每个处理个体匹配相似的对照个体。

有向无环图与 do-演算

Judea Pearl 提出的结构因果模型 (Structural Causal Model, SCM) 和有向无环图 (Directed Acyclic Graph, DAG) 提供了另一种表达因果关系的语言。DAG 用节点表示变量,用有向边表示直接的因果关系。通过 dodo-演算,可以在图形结构中形式化干预操作 do(X=x)do(X = x),即强制设定 XX 取某个值,并推导在此干预下 YY 的分布 P(Ydo(X=x))P(Y \mid do(X = x))。后门准则 (Backdoor Criterion) 和前门准则 (Frontdoor Criterion) 为判断何时可以通过观测数据识别因果效应提供了图形化判据。

格兰杰因果

在时间序列分析中,格兰杰因果 (Granger Causality) 是一种基于预测能力的因果概念:如果 XX 的过去值有助于预测 YY 的未来值(在已控制 YY 自身过去值的前提下),则称 XXYY 的格兰杰原因。需要注意的是,格兰杰因果不等于真正的结构因果:它捕捉的是时间上的预测关系,而非反事实意义上的因果机制。

经济学中的应用

因果推断方法在经济学中应用广泛:劳动经济学使用 DiD 和 IV 研究教育和培训的回报;发展经济学依赖 RCT 评估扶贫项目的效果;健康经济学利用 RDD 研究医保政策的影响。近年来,"可信度革命" (Credibility Revolution) 强调研究设计在因果识别中的优先性,推动了经济学从依赖结构性假设转向更加透明的准实验方法。

因果关系的建立需要理论、研究设计和统计方法的有机结合,是现代实证科学中最具挑战性也最为核心的任务之一。