Sargan-Hansen检验 (Sargan-Hansen Test)
Sargan-Hansen检验,又称过度识别约束检验(Overidentifying Restrictions Test)或J检验,是计量经济学 中用于检验工具变量 (IV)在过度识别情形下是否满足外生性的核心诊断工具。当工具变量数量 m m m 超过内生解释变量数量 k k k 时(m > k m > k m > k ),模型存在过度识别约束,此时并非所有正交条件都可同时成立;Sargan-Hansen检验正是利用这些过度识别信息来评估工具变量整体的有效性。该检验由Sargan(1958)在经典工具变量框架下首次提出,后由Hansen(1982)在广义矩估计 (GMM)框架下推广为异方差稳健形式,是现代实证研究的标准规范程序。
检验原理与假设
考虑线性模型 y i = x i ′ β + ϵ i y_i = \mathbf{x}_i' \boldsymbol{\beta} + \epsilon_i y i = x i ′ β + ϵ i 和工具变量矩阵 Z \mathbf{Z} Z (n × m n \times m n × m ,m > k m > k m > k )。工具变量的正交条件为 E [ Z ′ ϵ ] = 0 \mathbb{E}[\mathbf{Z}'\boldsymbol{\epsilon}] = \mathbf{0} E [ Z ′ ϵ ] = 0 。当 m > k m > k m > k 时,系统过度识别:无法找到 β ^ \hat{\boldsymbol{\beta}} β ^ 使所有 m m m 个样本矩条件同时为零。检验的原假设是所有工具变量均满足外生性 ,即 E [ z i ϵ i ] = 0 \mathbb{E}[\mathbf{z}_i \epsilon_i] = \mathbf{0} E [ z i ϵ i ] = 0 ;拒绝原假设意味着至少部分工具变量与误差项相关,提示工具变量选择可能存在问题。
Sargan统计量(同方差情形)
在两阶段最小二乘法 (2SLS)框架下,Sargan(1958)构造的检验统计量为:
S = ϵ ^ ′ P Z ϵ ^ ϵ ^ ′ ϵ ^ / n = n ⋅ ϵ ^ ′ Z ( Z ′ Z ) − 1 Z ′ ϵ ^ ϵ ^ ′ ϵ ^ → d χ m − k 2 S = \frac{\hat{\boldsymbol{\epsilon}}'\mathbf{P}_{\mathbf{Z}}\hat{\boldsymbol{\epsilon}}}{\hat{\boldsymbol{\epsilon}}'\hat{\boldsymbol{\epsilon}} / n} = n \cdot \frac{\hat{\boldsymbol{\epsilon}}'\mathbf{Z}(\mathbf{Z}'\mathbf{Z})^{-1}\mathbf{Z}'\hat{\boldsymbol{\epsilon}}}{\hat{\boldsymbol{\epsilon}}'\hat{\boldsymbol{\epsilon}}} \xrightarrow{d} \chi^2_{m-k} S = ϵ ^ ′ ϵ ^ / n ϵ ^ ′ P Z ϵ ^ = n ⋅ ϵ ^ ′ ϵ ^ ϵ ^ ′ Z ( Z ′ Z ) − 1 Z ′ ϵ ^ d χ m − k 2
其中 ϵ ^ = y − X β ^ 2SLS \hat{\boldsymbol{\epsilon}} = \mathbf{y} - \mathbf{X}\hat{\boldsymbol{\beta}}_{\text{2SLS}} ϵ ^ = y − X β ^ 2SLS 为2SLS残差,P Z \mathbf{P}_{\mathbf{Z}} P Z 为投影矩阵。Sargan统计量的直觉在于:若工具变量确实外生,2SLS残差与工具变量的样本相关性应接近于零,从而该二次型较小。在同方差假设 E [ ϵ i 2 ∣ z i ] = σ 2 \mathbb{E}[\epsilon_i^2 \mid \mathbf{z}_i] = \sigma^2 E [ ϵ i 2 ∣ z i ] = σ 2 下,S → d χ m − k 2 S \xrightarrow{d} \chi^2_{m-k} S d χ m − k 2 。
Hansen J统计量(异方差稳健情形)
Hansen(1982)将过度识别检验推广至GMM框架,允许任意形式的异方差性 和自相关。Hansen J统计量为:
J = n ⋅ g ˉ n ( β ^ ) ′ S ^ − 1 g ˉ n ( β ^ ) → d χ m − k 2 J = n \cdot \bar{\mathbf{g}}_n(\hat{\boldsymbol{\beta}})' \hat{\mathbf{S}}^{-1} \bar{\mathbf{g}}_n(\hat{\boldsymbol{\beta}}) \xrightarrow{d} \chi^2_{m-k} J = n ⋅ g ˉ n ( β ^ ) ′ S ^ − 1 g ˉ n ( β ^ ) d χ m − k 2
其中 g ˉ n ( β ^ ) = 1 n ∑ i = 1 n z i ϵ ^ i \bar{\mathbf{g}}_n(\hat{\boldsymbol{\beta}}) = \frac{1}{n}\sum_{i=1}^n \mathbf{z}_i \hat{\epsilon}_i g ˉ n ( β ^ ) = n 1 ∑ i = 1 n z i ϵ ^ i 为样本矩条件,S ^ \hat{\mathbf{S}} S ^ 为矩条件的异方差-自相关一致(HAC)协方差矩阵估计量。在恰好识别(m = k m = k m = k )情形下,J统计量恒为零,无法提供检验力。Hansen J统计量是现代实证实践中推荐的形式,因为其不依赖于同方差假设。
解释与使用注意事项
Sargan-Hansen检验在实证中有若干使用要点:第一,显著性检验:若统计量超过临界值(如 χ m − k , 0.05 2 \chi^2_{m-k, 0.05} χ m − k , 0.05 2 ),则拒绝原假设,提示至少部分工具变量无效,需重新审视工具变量选择;第二,不具识别性 :检验无法指出哪一个工具变量有问题,只能给出整体信号;第三,对弱工具变量敏感 :当工具变量较弱时,J检验的功效和尺寸性质可能扭曲;第四,实证中通常同时报告第一阶段F统计量(诊断弱工具变量)和过度识别J统计量,二者互补。
Sargan-Hansen检验是实证经济学研究的标准汇报内容。在劳动经济学、发展经济学和产业组织等以工具变量为基础的因果推断 文献中,研究者通常展示"过度识别检验通过(即无法拒绝原假设)"作为工具变量合理性论证的一部分。该检验与弱工具变量诊断及内生性检验共同构成了工具变量估计算法的完整验证链条。
关于知经 KNOWECON
知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌,长期面向北京大学、清华大学、中国人民大学等顶尖院校,提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考,并成功进入理想院校。
知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业,获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者,长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。
我们相信,好的考研辅导不只是押题和陪跑,更是把复杂知识讲清楚、把复习路径设计清楚,并用技术让学习过程更可追踪、更可反馈、更可坚持。