ARTICLE

Causality

因果性 (Causality) 因果性(Causality)指一个事件、过程或变量(因)对另一个事件、过程或变量(果)所产生的实质性影响。在经济学与统计学中,因果性区别于纯粹的相关性:相关性描述两个变量共同变动的统计模式,而因果性要求确立从原因到结果的方向性作用机制。因果推断(Causal Inference)是现代实证经济学、流行病学、政策评估和机器学习领

浏览 4 更新 2025-10-26

因果性 (Causality)

因果性(Causality)指一个事件、过程或变量(因)对另一个事件、过程或变量(果)所产生的实质性影响。在经济学与统计学中,因果性区别于纯粹的相关性:相关性描述两个变量共同变动的统计模式,而因果性要求确立从原因到结果的方向性作用机制。因果推断(Causal Inference)是现代实证经济学、流行病学、政策评估和机器学习领域的核心方法论,其目标是从观测数据或实验数据中识别并估计因果效应的方向和大小。

相关不等于因果

"相关不等于因果"(Correlation Does Not Imply Causation)是统计推断中最根本的警示。两个变量之间的统计关联可能来源于五种逻辑上不同的关系:(1)XX 导致 YY;(2)YY 导致 XX(反向因果);(3)XXYY 互为因果;(4)第三个变量 ZZ 同时导致 XXYY混杂因素);(5)纯粹的偶然。仅凭相关系数或回归系数无法区分这五种情形。

经典例证包括:冰激凌销量与溺水死亡人数高度正相关,但二者均受夏季高温这一混杂因素的驱动;教育年限与收入正相关,但能力(不可观测的混杂)可能同时影响受教育程度和收入水平。经济学中,价格与数量的同时性(联立性偏误)使得需求曲线和供给曲线的识别面临根本困难——观测到的价格-数量组合是两条曲线的交点,而非其中任何一条曲线本身。

潜在结果框架

鲁宾因果模型(Rubin Causal Model, RCM),亦称潜在结果框架(Potential Outcomes Framework),由Jerzy Neyman(1923年)和Donald Rubin(1974年)系统发展,是当代因果推断的理论基石。该框架将因果效应定义为同一单元在接受处理与未接受处理两种反事实情形下结果的差异。

设对于个体 ii,二值处理变量 Di{0,1}D_i \in \{0, 1\},潜在结果 Yi(1)Y_i(1) 为接受处理时的结果,Yi(0)Y_i(0) 为未接受处理时的结果。个体层面的因果效应为:

τi=Yi(1)Yi(0)\tau_i = Y_i(1) - Y_i(0)

然而,对于任何一个体,我们只能观测到其实际接受处理状态下的结果,无法同时观测到反事实状态的结果——这被称为因果推断的根本问题(Fundamental Problem of Causal Inference)。观测结果可写为:

Yi=DiYi(1)+(1Di)Yi(0)Y_i = D_i Y_i(1) + (1 - D_i) Y_i(0)

由于个体因果效应不可直接观测,研究通常转向估计平均因果效应(Average Treatment Effect, ATE):

τATE=E[Yi(1)Yi(0)]\tau_{\text{ATE}} = \mathbb{E}[Y_i(1) - Y_i(0)]

以及处理组平均因果效应(ATT)和条件平均因果效应(CATE)等变体。

在随机实验中,处理分配独立于潜在结果 (Yi(1),Yi(0)) ⁣ ⁣ ⁣Di(Y_i(1), Y_i(0)) \perp\!\!\!\perp D_i,ATE可以通过均值之差一致估计:

τ^ATE=Yˉ处理Yˉ控制\widehat{\tau}_{\text{ATE}} = \bar{Y}_{\text{处理}} - \bar{Y}_{\text{控制}}

但在观测研究中,处理分配通常非随机,需依赖识别策略。

主要识别策略

工具变量法。当存在遗漏变量导致内生性时,工具变量 ZZ 需满足两个条件:相关性(ZZ 与内生变量 DD 相关)和外生性(ZZ 仅通过 DD 影响 YY,与不可观测因素不相关)。二阶段最小二乘法(2SLS)是经典的IV估计方法,在满足单调性假设时,IV估计量可解释为局部平均处理效应(LATE)——即受工具变量影响的"依从者"(Compliers)群体的平均因果效应。Angrist、Imbens和Rubin对LATE的阐释是因果关系从不可知到可局部识别的关键突破。

双重差分法双重差分(Difference-in-Differences, DiD)利用面板数据中的时间维度,通过比较处理组与对照组在政策实施前后结果变量的变化来识别因果效应:

τDiD=(Yˉ处理, 后Yˉ处理, 前)(Yˉ控制, 后Yˉ控制, 前)\tau_{\text{DiD}} = (\bar{Y}_{\text{处理, 后}} - \bar{Y}_{\text{处理, 前}}) - (\bar{Y}_{\text{控制, 后}} - \bar{Y}_{\text{控制, 前}})

DiD的有效性依赖于平行趋势假设——即若无政策干预,处理组与对照组的结果变化轨迹本应相同。

断点回归断点回归设计(Regression Discontinuity Design, RDD)利用处理分配在某个连续变量临界值处的非连续性跳跃。若个体在某个"运行变量"达到阈值 cc 时概率性地获得处理,且其他特征在 cc 附近连续变化,则临界值附近的比较近似于局部随机实验。精确断点回归中,因果效应为:

τRDD=limxcE[YiXi=x]limxcE[YiXi=x]\tau_{\text{RDD}} = \lim_{x \downarrow c} \mathbb{E}[Y_i \mid X_i = x] - \lim_{x \uparrow c} \mathbb{E}[Y_i \mid X_i = x]

匹配方法倾向得分匹配(Propensity Score Matching, PSM)基于可观测特征估计每个个体接受处理的概率(倾向得分),将得分相近的处理组与对照组个体配对比较。PSM的有效性依赖于条件独立性假设(CIA),即控制可观测协变量后处理分配独立于潜在结果。当重要混杂因素不可观测时,匹配估计可能仍存在偏误。

格兰杰因果性

格兰杰因果性(Granger Causality)由Clive Granger于1969年提出,是时间序列分析中特有的因果概念。其定义为:若在给定 YY 的过去值后,加入 XX 的过去值能显著提升对 YY 的预测精度,则称 XXYY 的格兰杰原因。检验通常在VAR模型框架下通过 FF 检验进行。需特别强调,格兰杰因果性本质上是预测性概念,并非上述潜在结果框架中的结构因果性——它检验的是时间上的先行-后继关系与预测能力的增量,而非反事实意义上的因果效应。

结构因果模型与有向无环图

Judea Pearl提出的结构因果模型(Structural Causal Model, SCM)提供了因果推断的图形化语言。有向无环图(DAG)用节点表示变量,有向边表示直接的因果作用。通过d-分离(d-Separation)准则,DAG可以系统地判断变量间的条件独立性关系,识别混杂路径、对撞路径和中介路径。Pearl引入的do-算子 P(Ydo(X=x))P(Y \mid do(X = x)) 形式化了干预操作,区分了"观测到 X=xX = x"(条件概率)与"将 XX 设定为 xx"(干预概率)的本质差异。后门准则(Backdoor Criterion)和前门准则(Frontdoor Criterion)则为从观测数据中识别因果效应提供了系统的图形判定规则。

在经济学中的应用与前沿

因果推断方法深刻重塑了应用经济学的实证范式。劳动经济学中,明瑟方程的回报率估计长期受能力偏误困扰,Angrist与Krueger(1991)使用出生季度作为教育年限的工具变量,开创性地将IV方法引入教育回报领域。发展经济学中,随机对照试验(RCT)的大规模应用——以Duflo、Banerjee和Kremer为代表——使因果识别的内部有效性达到新高度,同时也引发了关于外部有效性和一般均衡效应的持续讨论。产业组织中,Olley-Pakes方法、Levinsohn-Petrin方法等结构估计技术将因果识别与经济学理论模型深度结合。

前沿方向包括:合成控制法在比较案例研究中的应用(如Abadie与Gardeazabal对巴斯克地区恐怖主义经济影响的估计);因果森林与因果机器学习在高维协变量下的异质性处理效应估计;工具变量的重新阐释与弱工具变量问题的诊断;以及在一般均衡框架下将微观因果估计聚合为宏观政策效应的挑战。