ARTICLE
Sargan–Hansen检验
Sargan–Hansen检验 (Sargan–Hansen Test) Sargan–Hansen检验,又称过度识别检验 (Test of Overidentifying Restrictions) 或J检验 (J Test),是 计量经济学 (Econometrics) 中用于评估 工具变量 (Instrumental Variables, IV) 估计
Sargan–Hansen检验 (Sargan–Hansen Test)
Sargan–Hansen检验,又称过度识别检验 (Test of Overidentifying Restrictions) 或J检验 (J Test),是 计量经济学 (Econometrics) 中用于评估 工具变量 (Instrumental Variables, IV) 估计中 过度识别约束 (Overidentifying Restrictions) 有效性的核心 统计检验 方法。该检验由 约翰·丹尼斯·萨甘 (John Denis Sargan) 于1958年在其经典论文 The Estimation of Economic Relationships Using Instrumental Variables 中首次提出,后经 拉尔斯·彼得·汉森 (Lars Peter Hansen, 2013年 诺贝尔经济学奖 得主) 于1982年在 Generalized Method of Moments 框架下加以推广,形成了统一的 过度识别检验 (Hansen J Test) 体系。该检验的 原假设 (Null Hypothesis) 为:所有工具变量均为外生变量,即工具变量与 误差项 (Error Term) 不相关,且模型设定正确。
理论背景与动机
在 线性回归模型 (Linear Regression Model) 中,当解释变量与误差项存在相关性时(即 内生性 (Endogeneity) 问题),普通最小二乘法 (OLS) 的估计量将不再具备 一致性 (Consistency)。工具变量法通过引入一组外部变量(即工具变量)来修正内生性偏误。理论上,为识别一个内生变量的系数,至少需要一个与之相关的工具变量,此即 恰好识别 (Exactly Identified) 情形。然而,当可利用的工具变量数量超过内生变量数量时,模型便进入 过度识别 (Overidentified) 情形。此时,研究者面临一个关键问题:这些额外的工具变量是否确实满足外生性条件?Sargan–Hansen检验正是为回答这一问题而设计的统计诊断工具。
数学表达与检验原理
基本设定
考虑线性回归模型:
其中 为 维被解释变量, 为 维解释变量矩阵(可能包含内生变量), 为 维待估参数向量, 为 维误差项。设 为 维工具变量矩阵(满足 ,即过度识别情形)。
检验统计量的构造
Sargan–Hansen检验统计量的一般形式为:
其中 为 二阶段最小二乘法 (Two-Stage Least Squares, 2SLS) 或 广义矩估计 (Generalized Method of Moments, GMM) 估计后的残差向量, 为误差项 协方差矩阵 (Covariance Matrix) 的一致估计量。在 同方差 (Homoskedasticity) 假设下,统计量可简化为经典 Sargan检验 形式:
其中 为将残差 对全部工具变量 进行 辅助回归 (Auxiliary Regression) 所得的 判定系数。该统计量在原假设下 渐近 (Asymptotically) 服从 卡方分布 (Chi-squared Distribution),自由度 (Degrees of Freedom) 等于过度识别约束的数量 。
Sargan检验与Hansen J检验的区别
二者在核心思想上一致,但在假设条件和适用范围上存在重要区别:
- Sargan检验(经典形式):适用于 同方差 (Homoskedastic) 情形下的 2SLS 估计。统计量计算简便,但要求误差项满足同方差假设,否则检验结论不可靠。
- Hansen J检验(广义形式):由 Hansen (1982) 在 GMM 框架下提出,适用于 异方差 (Heteroskedasticity) 和 自相关 (Autocorrelation) 等更一般的情形。通过使用稳健的协方差矩阵估计量(如 HAC 估计量),Hansen J检验在存在异方差或自相关时仍保持有效性。在 Stata 等软件中,\texttt{ivreg2} 命令后汇报的 Hansen J 统计量即为这一广义版本。
在计量经济学实践中,当样本量充足且同方差假设存疑时,研究者更倾向于使用 Hansen J 检验以提高推断的稳健性。
判断准则与使用步骤
实际操作流程
- 模型估计:使用 2SLS 或 GMM 方法估计结构模型,获取系数估计值和残差向量 。
- 统计量计算:根据假设条件选择 Sargan 或 Hansen J 统计量公式计算检验值。
- 临界值比较:将计算得到的 J 统计量与给定 显著性水平 (Significance Level, 如 0.05) 下自由度 的卡方分布临界值进行比较。
- 结论判定:若 (或 p值 < 0.05),则拒绝原假设,表明至少部分工具变量与误差项存在相关性,工具集的整体有效性存疑;反之,若不能拒绝原假设,则接受工具变量外生性假设。
决策规则
需特别强调,接受原假设并不意味着工具变量一定有效,仅表明在现有样本条件下未发现显著违反外生性的证据。因此,Sargan–Hansen检验通常仅作为必要而非充分的诊断工具。
应用场景
Sargan–Hansen检验在实证研究中具有广泛的应用价值:
- 面板数据 GMM 估计:在 动态面板模型 (Dynamic Panel Data Model) 中使用 Arellano–Bond估计 (Arellano–Bond Estimator) 或 Blundell–Bond系统GMM估计 (System GMM) 时,Sargan–Hansen检验是评估工具变量(即滞后值差分和水平值)外生性的标准汇报指标。
- 发展经济学与劳动经济学:在使用 地理变量、历史制度变量 或 政策冲击 作为工具变量处理内生性问题时,过度识别检验为工具集的有效性提供统计佐证。例如,Acemoglu, Johnson \& Robinson (2001) 在检验制度对经济发展的因果效应时,将过度识别检验作为重要稳健性分析工具。
- 金融经济学:在资产定价模型的 广义矩估计 (GMM) 估计中,Hansen J检验是评估 欧拉方程 (Euler Equation) 设定和 矩条件 (Moment Conditions) 有效性的标准检验。
- 宏观经济学:在估计 消费资本资产定价模型 (CCAPM) 或 新凯恩斯菲利普斯曲线 (New Keynesian Phillips Curve) 等结构性宏观模型时,过度识别检验用于验证模型隐含的跨期约束条件。
局限性与注意事项
在实际应用中,Sargan–Hansen检验存在若干重要局限,需引起高度重视:
- 低检验功效 (Low Power):在样本量有限或工具变量数量众多时,Sargan–Hansen检验的 统计功效 (Statistical Power) 通常较低,即在实际存在过度识别约束违背时也难以拒绝原假设,导致误判。这一局限在弱工具变量 (Weak Instruments) 情境下尤为严重。
- 弱工具变量下的扭曲:当工具变量与内生变量的相关性较弱时(即 弱工具变量问题 (Weak Instruments)),Sargan–Hansen检验可能产生严重 尺寸扭曲 (Size Distortion),倾向于过度拒绝具有良好性质的工具集。这一现象由 Stock \& Wright (2000) 等学者系统研究。
- 无法识别具体违规变量:过度识别检验仅能提供工具集整体的有效性判断,无法明确指出哪些工具变量违反了外生性假设。研究者需结合经济理论或采用其他诊断方法(如 子集检验 (Subset Test) 或 Durbin–Wu–Hausman检验 (Durbin–Wu–Hausman Test))进行进一步分析。
- 同方差假设敏感:经典 Sargan 检验在异方差存在时会产生偏误。因此,在数据存在异方差特征较为明显时(如 横截面数据 (Cross-sectional Data) 或 微观调查数据 (Micro Survey Data)),必须使用异方差稳健版本的 Hansen J 检验。
- 多重假设检验问题:当研究者在同一研究中反复使用过度识别检验进行模型选择的 预检验 (Pre-testing) 时,会遭遇逐步推断 (Sequential Inference) 带来的整体 显著性水平 膨胀问题,即所谓 数据窥察 (Data Snooping) 偏误。
软件实现
主流统计软件均提供了 Sargan–Hansen 检验的标准化实现。在 Stata 中,\texttt{ivreg2} 和 \texttt{xtabond2} 命令自动汇报 Hansen J 统计量和 p 值,经典 \texttt{ivregress} 命令则提供 Sargan 统计量;在 R语言 (R Language) 中,\texttt{AER} 包的 \texttt{ivreg()} 函数和 \texttt{plm} 包的 \texttt{pgmm()} 函数均可输出过度识别检验结果;在 Python 中,\texttt{linearmodels} 包的 \texttt{IV2SLS} 类提供了 Sargan 检验的计算功能;在 MATLAB 和 EViews 中,过度识别检验作为 IV/GMM 估计模块的内置功能可直接调用。