ARTICLE

Sargan–Hansen检验

Sargan–Hansen检验 (Sargan–Hansen Test) Sargan–Hansen检验，又称过度识别检验 (Test of Overidentifying Restrictions) 或J检验 (J Test)，是计量经济学 (Econometrics) 中用于评估工具变量 (Instrumental Variables, IV) 估计

浏览 0 更新 2026-07-11

Sargan–Hansen检验 (Sargan–Hansen Test)

Sargan–Hansen检验，又称过度识别检验 (Test of Overidentifying Restrictions) 或J检验 (J Test)，是计量经济学 (Econometrics) 中用于评估工具变量 (Instrumental Variables, IV) 估计中 过度识别约束 (Overidentifying Restrictions) 有效性的核心统计检验方法。该检验由约翰·丹尼斯·萨甘 (John Denis Sargan) 于1958年在其经典论文 The Estimation of Economic Relationships Using Instrumental Variables 中首次提出，后经拉尔斯·彼得·汉森 (Lars Peter Hansen, 2013年诺贝尔经济学奖得主) 于1982年在 Generalized Method of Moments 框架下加以推广，形成了统一的 过度识别检验 (Hansen J Test) 体系。该检验的原假设 (Null Hypothesis) 为：所有工具变量均为外生变量，即工具变量与误差项 (Error Term) 不相关，且模型设定正确。

理论背景与动机

在线性回归模型 (Linear Regression Model) 中，当解释变量与误差项存在相关性时（即内生性 (Endogeneity) 问题），普通最小二乘法 (OLS) 的估计量将不再具备一致性 (Consistency)。工具变量法通过引入一组外部变量（即工具变量）来修正内生性偏误。理论上，为识别一个内生变量的系数，至少需要一个与之相关的工具变量，此即 恰好识别 (Exactly Identified) 情形。然而，当可利用的工具变量数量超过内生变量数量时，模型便进入 过度识别 (Overidentified) 情形。此时，研究者面临一个关键问题：这些额外的工具变量是否确实满足外生性条件？Sargan–Hansen检验正是为回答这一问题而设计的统计诊断工具。

数学表达与检验原理

基本设定

考虑线性回归模型：

y = X\beta + \varepsilon

其中 $y$ 为 $T \times 1$ 维被解释变量， $X$ 为 $T \times k$ 维解释变量矩阵（可能包含内生变量）， $\beta$ 为 $k \times 1$ 维待估参数向量， $\varepsilon$ 为 $T \times 1$ 维误差项。设 $Z$ 为 $T \times m$ 维工具变量矩阵（满足 $m > k$ ，即过度识别情形）。

检验统计量的构造

Sargan–Hansen检验统计量的一般形式为：

J = T \cdot \hat{\varepsilon}' Z (Z' \hat{\Omega} Z)^{-1} Z' \hat{\varepsilon} \sim \chi^2(m - k)

其中 $\hat{\varepsilon}$ 为二阶段最小二乘法 (Two-Stage Least Squares, 2SLS) 或广义矩估计 (Generalized Method of Moments, GMM) 估计后的残差向量， $\hat{\Omega}$ 为误差项协方差矩阵 (Covariance Matrix) 的一致估计量。在同方差 (Homoskedasticity) 假设下，统计量可简化为经典 Sargan检验 形式：

\text{Sargan} = T \cdot R^2 \sim \chi^2(m - k)

其中 $R^2$ 为将残差 $\hat{\varepsilon}$ 对全部工具变量 $Z$ 进行辅助回归 (Auxiliary Regression) 所得的判定系数。该统计量在原假设下渐近 (Asymptotically) 服从卡方分布 (Chi-squared Distribution)，自由度 (Degrees of Freedom) 等于过度识别约束的数量 $m - k$ 。

Sargan检验与Hansen J检验的区别

二者在核心思想上一致，但在假设条件和适用范围上存在重要区别：

Sargan检验（经典形式）：适用于同方差 (Homoskedastic) 情形下的 2SLS 估计。统计量计算简便，但要求误差项满足同方差假设，否则检验结论不可靠。
Hansen J检验（广义形式）：由 Hansen (1982) 在 GMM 框架下提出，适用于异方差 (Heteroskedasticity) 和自相关 (Autocorrelation) 等更一般的情形。通过使用稳健的协方差矩阵估计量（如 HAC 估计量），Hansen J检验在存在异方差或自相关时仍保持有效性。在 Stata 等软件中，\texttt{ivreg2} 命令后汇报的 Hansen J 统计量即为这一广义版本。

在计量经济学实践中，当样本量充足且同方差假设存疑时，研究者更倾向于使用 Hansen J 检验以提高推断的稳健性。

判断准则与使用步骤

实际操作流程

模型估计：使用 2SLS 或 GMM 方法估计结构模型，获取系数估计值和残差向量 $\hat{\varepsilon}$ 。
统计量计算：根据假设条件选择 Sargan 或 Hansen J 统计量公式计算检验值。
临界值比较：将计算得到的 J 统计量与给定显著性水平 (Significance Level, 如 0.05) 下自由度 $m - k$ 的卡方分布临界值进行比较。
结论判定：若 $J > \chi^2_{\alpha}(m - k)$ （或 p值 < 0.05），则拒绝原假设，表明至少部分工具变量与误差项存在相关性，工具集的整体有效性存疑；反之，若不能拒绝原假设，则接受工具变量外生性假设。

决策规则

需特别强调，接受原假设并不意味着工具变量一定有效，仅表明在现有样本条件下未发现显著违反外生性的证据。因此，Sargan–Hansen检验通常仅作为必要而非充分的诊断工具。

应用场景

Sargan–Hansen检验在实证研究中具有广泛的应用价值：

面板数据 GMM 估计：在动态面板模型 (Dynamic Panel Data Model) 中使用 Arellano–Bond估计 (Arellano–Bond Estimator) 或 Blundell–Bond系统GMM估计 (System GMM) 时，Sargan–Hansen检验是评估工具变量（即滞后值差分和水平值）外生性的标准汇报指标。
发展经济学与劳动经济学：在使用地理变量、历史制度变量或政策冲击作为工具变量处理内生性问题时，过度识别检验为工具集的有效性提供统计佐证。例如，Acemoglu, Johnson \& Robinson (2001) 在检验制度对经济发展的因果效应时，将过度识别检验作为重要稳健性分析工具。
金融经济学：在资产定价模型的广义矩估计 (GMM) 估计中，Hansen J检验是评估欧拉方程 (Euler Equation) 设定和矩条件 (Moment Conditions) 有效性的标准检验。
宏观经济学：在估计消费资本资产定价模型 (CCAPM) 或新凯恩斯菲利普斯曲线 (New Keynesian Phillips Curve) 等结构性宏观模型时，过度识别检验用于验证模型隐含的跨期约束条件。

局限性与注意事项

在实际应用中，Sargan–Hansen检验存在若干重要局限，需引起高度重视：

低检验功效 (Low Power)：在样本量有限或工具变量数量众多时，Sargan–Hansen检验的统计功效 (Statistical Power) 通常较低，即在实际存在过度识别约束违背时也难以拒绝原假设，导致误判。这一局限在弱工具变量 (Weak Instruments) 情境下尤为严重。
弱工具变量下的扭曲：当工具变量与内生变量的相关性较弱时（即弱工具变量问题 (Weak Instruments)），Sargan–Hansen检验可能产生严重尺寸扭曲 (Size Distortion)，倾向于过度拒绝具有良好性质的工具集。这一现象由 Stock \& Wright (2000) 等学者系统研究。
无法识别具体违规变量：过度识别检验仅能提供工具集整体的有效性判断，无法明确指出哪些工具变量违反了外生性假设。研究者需结合经济理论或采用其他诊断方法（如子集检验 (Subset Test) 或 Durbin–Wu–Hausman检验 (Durbin–Wu–Hausman Test)）进行进一步分析。
同方差假设敏感：经典 Sargan 检验在异方差存在时会产生偏误。因此，在数据存在异方差特征较为明显时（如横截面数据 (Cross-sectional Data) 或微观调查数据 (Micro Survey Data)），必须使用异方差稳健版本的 Hansen J 检验。
多重假设检验问题：当研究者在同一研究中反复使用过度识别检验进行模型选择的预检验 (Pre-testing) 时，会遭遇逐步推断 (Sequential Inference) 带来的整体显著性水平膨胀问题，即所谓数据窥察 (Data Snooping) 偏误。

软件实现

主流统计软件均提供了 Sargan–Hansen 检验的标准化实现。在 Stata 中，\texttt{ivreg2} 和 \texttt{xtabond2} 命令自动汇报 Hansen J 统计量和 p 值，经典 \texttt{ivregress} 命令则提供 Sargan 统计量；在 R语言 (R Language) 中，\texttt{AER} 包的 \texttt{ivreg()} 函数和 \texttt{plm} 包的 \texttt{pgmm()} 函数均可输出过度识别检验结果；在 Python 中，\texttt{linearmodels} 包的 \texttt{IV2SLS} 类提供了 Sargan 检验的计算功能；在 MATLAB 和 EViews 中，过度识别检验作为 IV/GMM 估计模块的内置功能可直接调用。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。