ARTICLE
因果性
因果性 (Causality) 因果性(Causality)指一个事件、过程或变量(因)对另一个事件、过程或变量(果)所产生的实质性影响。在科学方法论中,因果性不同于纯粹的相关性——相关性描述变量间的统计关联模式,而因果性要求确立从原因到结果的方向性作用机制。因果推断是现代实证科学的核心议题,广泛应用于经济学和社会学。 相关性与因果性的根本区别 "相关不等于
因果性 (Causality)
因果性(Causality)指一个事件、过程或变量(因)对另一个事件、过程或变量(果)所产生的实质性影响。在科学方法论中,因果性不同于纯粹的相关性——相关性描述变量间的统计关联模式,而因果性要求确立从原因到结果的方向性作用机制。因果推断是现代实证科学的核心议题,广泛应用于经济学和社会学。
相关性与因果性的根本区别
"相关不等于因果"(Correlation Does Not Imply Causation)是统计推断中最根本的警示。两个变量之间的统计关联可能来源于多种逻辑关系:(1) 导致 ;(2) 导致 (反向因果);(3) 与 互为因果;(4)第三个变量 同时导致 与 (混杂因素);(5)纯粹的抽样偶然性。
经典例子包括:冰激凌销量与溺水人数正相关,但二者均受夏季高温这一混杂因素的驱动;教育年限与收入正相关,但个人能力(不可观测的混杂)可能同时影响受教育程度和收入水平。经济学中,价格与数量的联立性使得需求曲线和供给曲线的识别面临根本困难。
潜在结果框架
潜在结果框架(Potential Outcomes Framework),亦称鲁宾因果模型(Rubin Causal Model, RCM),由 Jerzy Neyman(1923)和 Donald Rubin(1974)系统发展,是当代因果推断的理论基石。该框架将因果效应定义为同一单元在接受处理与未接受处理两种反事实情形下结果的差异。
对于个体 ,设二值处理变量 ,潜在结果 为接受处理的结果, 为未接受处理的结果。个体因果效应为:
然而,对于任何一个体,我们只能观测到其实际接受处理状态下的结果,无法同时观测反事实结果——这被称为因果推断的根本问题(Fundamental Problem of Causal Inference)。观测结果可写为:
因此,研究通常转向估计平均因果效应(Average Treatment Effect, ATE):
在随机实验中,处理分配独立于潜在结果,ATE 可通过处理组与控制组均值之差一致估计。但在观测研究中,处理分配通常非随机,需依赖专门的识别策略。
主要因果识别策略
工具变量法(Instrumental Variables, IV)。当存在遗漏变量导致内生性时,工具变量 需满足相关性( 与处理变量 相关)和外生性( 仅通过 影响结果 )。在单调性假设下,IV 估计量可解释为局部平均处理效应(Local Average Treatment Effect, LATE),即受工具变量影响的依从者群体的平均因果效应。
双重差分法(Difference-in-Differences, DiD)。利用面板数据中的时间维度,通过比较处理组与对照组在政策实施前后结果变量的变化来识别因果效应:
DiD 的有效性依赖于平行趋势假设——若无政策干预,处理组与对照组的结果变化轨迹应相同。
断点回归设计(Regression Discontinuity Design, RDD)。利用处理分配在某个连续变量临界值处的非连续性跳跃。若个体在运行变量达到阈值 时获得处理,且其他特征在 附近连续变化,则临界值附近的比较近似于局部随机实验:
倾向得分匹配(Propensity Score Matching, PSM)。基于可观测特征估计每个个体接受处理的概率(倾向得分),将得分相近的处理组与对照组个体配对比较。其有效性依赖于条件独立性假设(CIA),即控制可观测协变量后处理分配独立于潜在结果。
结构因果模型与图形化方法
Judea Pearl 提出的结构因果模型(SCM)提供了因果推断的图形化语言。有向无环图(DAG)用节点表示变量,有向边表示直接的因果作用。通过 d-分离准则可判断变量间的条件独立性,识别混杂路径、对撞路径和中介路径。Pearl 引入的 do-算子 形式化了干预操作,区分了条件概率与干预概率的本质差异。
格兰杰因果性
格兰杰因果性(Granger Causality)由 Clive Granger 于 1969 年提出,是时间序列分析中特有的因果概念。其定义为:若在给定 的过去值后,加入 的过去值能显著提升对 的预测精度,则称 是 的格兰杰原因。格兰杰因果性本质上是预测性概念,检验的是时间上的先行-后继关系与预测能力的增量,而非反事实意义上的结构性因果效应。
因果推断在经济学中的应用
因果推断方法深刻重塑了应用经济学的实证范式。劳动经济学中,Angrist 与 Krueger(1991)使用出生季度作为教育年限的工具变量,开创性地将 IV 方法引入教育回报领域。发展经济学中,随机对照试验的大规模应用提高了因果识别的内部有效性。产业组织领域的结构估计技术将因果识别与经济学理论深度结合。前沿方向包括合成控制法、因果森林与异质性处理效应估计。