ARTICLE

Sargan-Hansen检验

Sargan-Hansen检验 (Sargan-Hansen Test) Sargan-Hansen检验,又称过度识别约束检验(Overidentifying Restrictions Test)或J检验,是计量经济学中用于检验工具变量(IV)在过度识别情形下是否满足外生性的核心诊断工具。当工具变量数量 m 超过内生解释变量数量 k 时( m > k ),模

浏览 3 更新 2026-07-20

Sargan-Hansen检验 (Sargan-Hansen Test)

Sargan-Hansen检验,又称过度识别约束检验(Overidentifying Restrictions Test)或J检验,是计量经济学中用于检验工具变量(IV)在过度识别情形下是否满足外生性的核心诊断工具。当工具变量数量 m m 超过内生解释变量数量 k k 时(m>k m > k ),模型存在过度识别约束,此时并非所有正交条件都可同时成立;Sargan-Hansen检验正是利用这些过度识别信息来评估工具变量整体的有效性。该检验由Sargan(1958)在经典工具变量框架下首次提出,后由Hansen(1982)在广义矩估计(GMM)框架下推广为异方差稳健形式,是现代实证研究的标准规范程序。

检验原理与假设

考虑线性模型 yi=xiβ+ϵi y_i = \mathbf{x}_i' \boldsymbol{\beta} + \epsilon_i 和工具变量矩阵 Z \mathbf{Z} n×m n \times m m>k m > k )。工具变量的正交条件为 E[Zϵ]=0 \mathbb{E}[\mathbf{Z}'\boldsymbol{\epsilon}] = \mathbf{0} 。当 m>k m > k 时,系统过度识别:无法找到 β^\hat{\boldsymbol{\beta}} 使所有 m m 个样本矩条件同时为零。检验的原假设是所有工具变量均满足外生性,即 E[ziϵi]=0 \mathbb{E}[\mathbf{z}_i \epsilon_i] = \mathbf{0} ;拒绝原假设意味着至少部分工具变量与误差项相关,提示工具变量选择可能存在问题。

Sargan统计量(同方差情形)

两阶段最小二乘法(2SLS)框架下,Sargan(1958)构造的检验统计量为:

S=ϵ^PZϵ^ϵ^ϵ^/n=nϵ^Z(ZZ)1Zϵ^ϵ^ϵ^dχmk2S = \frac{\hat{\boldsymbol{\epsilon}}'\mathbf{P}_{\mathbf{Z}}\hat{\boldsymbol{\epsilon}}}{\hat{\boldsymbol{\epsilon}}'\hat{\boldsymbol{\epsilon}} / n} = n \cdot \frac{\hat{\boldsymbol{\epsilon}}'\mathbf{Z}(\mathbf{Z}'\mathbf{Z})^{-1}\mathbf{Z}'\hat{\boldsymbol{\epsilon}}}{\hat{\boldsymbol{\epsilon}}'\hat{\boldsymbol{\epsilon}}} \xrightarrow{d} \chi^2_{m-k}

其中 ϵ^=yXβ^2SLS \hat{\boldsymbol{\epsilon}} = \mathbf{y} - \mathbf{X}\hat{\boldsymbol{\beta}}_{\text{2SLS}} 为2SLS残差,PZ \mathbf{P}_{\mathbf{Z}} 为投影矩阵。Sargan统计量的直觉在于:若工具变量确实外生,2SLS残差与工具变量的样本相关性应接近于零,从而该二次型较小。在同方差假设 E[ϵi2zi]=σ2 \mathbb{E}[\epsilon_i^2 \mid \mathbf{z}_i] = \sigma^2 下,Sdχmk2 S \xrightarrow{d} \chi^2_{m-k}

Hansen J统计量(异方差稳健情形)

Hansen(1982)将过度识别检验推广至GMM框架,允许任意形式的异方差性和自相关。Hansen J统计量为:

J=ngˉn(β^)S^1gˉn(β^)dχmk2J = n \cdot \bar{\mathbf{g}}_n(\hat{\boldsymbol{\beta}})' \hat{\mathbf{S}}^{-1} \bar{\mathbf{g}}_n(\hat{\boldsymbol{\beta}}) \xrightarrow{d} \chi^2_{m-k}

其中 gˉn(β^)=1ni=1nziϵ^i \bar{\mathbf{g}}_n(\hat{\boldsymbol{\beta}}) = \frac{1}{n}\sum_{i=1}^n \mathbf{z}_i \hat{\epsilon}_i 为样本矩条件,S^ \hat{\mathbf{S}} 为矩条件的异方差-自相关一致(HAC)协方差矩阵估计量。在恰好识别(m=k m = k )情形下,J统计量恒为零,无法提供检验力。Hansen J统计量是现代实证实践中推荐的形式,因为其不依赖于同方差假设。

解释与使用注意事项

Sargan-Hansen检验在实证中有若干使用要点:第一,显著性检验:若统计量超过临界值(如 χmk,0.052 \chi^2_{m-k, 0.05} ),则拒绝原假设,提示至少部分工具变量无效,需重新审视工具变量选择;第二,不具识别性:检验无法指出哪一个工具变量有问题,只能给出整体信号;第三,对弱工具变量敏感:当工具变量较弱时,J检验的功效和尺寸性质可能扭曲;第四,实证中通常同时报告第一阶段F统计量(诊断弱工具变量)和过度识别J统计量,二者互补。

Sargan-Hansen检验是实证经济学研究的标准汇报内容。在劳动经济学、发展经济学和产业组织等以工具变量为基础的因果推断文献中,研究者通常展示"过度识别检验通过(即无法拒绝原假设)"作为工具变量合理性论证的一部分。该检验与弱工具变量诊断及内生性检验共同构成了工具变量估计算法的完整验证链条。