ARTICLE

广义矩方法

广义矩方法 (GMM) 广义矩方法(Generalized Method of Moments, GMM)是计量经济学和统计学中一种极为重要和普适的估计方法,由诺贝尔经济学奖得主Lars Peter Hansen于1982年系统性地提出。GMM的核心思想是利用经济理论所蕴含的矩条件(Moment Conditions)来估计模型参数。由于其设定的普适性,许多

浏览 5 更新 2025-10-29

广义矩方法 (GMM)

广义矩方法(Generalized Method of Moments, GMM)是计量经济学统计学中一种极为重要和普适的估计方法,由诺贝尔经济学奖得主Lars Peter Hansen于1982年系统性地提出。GMM的核心思想是利用经济理论所蕴含的矩条件(Moment Conditions)来估计模型参数。由于其设定的普适性,许多经典的估计方法如OLS工具变量法乃至最大似然估计都可以被视为GMM的特例。

核心概念:矩条件

GMM的基石是总体矩条件。一个典型的总体矩条件表达为E[g(Yi,θ0)]=0E[g(Y_i, \theta_0)] = 0,其中YiY_i代表第ii个观测值的数据向量,θ0\theta_0是维度为p×1p \times 1的真实参数向量,g()g(\cdot)是维度为q×1q \times 1的向量函数。这个等式意味着在真实的参数值下,函数g(Yi,θ0)g(Y_i, \theta_0)的理论平均值为零。这些条件通常来源于经济模型的优化条件(如消费者的欧拉方程)或关于误差项与外生变量之间正交性的假设。

GMM遵循矩方法的基本思想:用样本矩去匹配总体矩。将总体矩条件替换为其样本对应物gˉn(θ)=(1/n)i=1ng(Yi,θ)\bar{g}_n(\theta) = (1/n)\sum_{i=1}^n g(Y_i, \theta),GMM估计量的目标是寻找参数估计值θ^\hat{\theta}使得样本矩尽可能接近零。

识别与估计

矩条件数量qq与待估参数数量pp之间的关系决定了估计方式。当q=pq=p时(恰好识别),可以直接通过求解方程组gˉn(θ)=0\bar{g}_n(\theta) = 0得到唯一解,即经典的矩方法。当q>pq > p时(过度识别),无法同时使所有qq个矩条件都恰好等于零,需要寻找一个折衷方案。

GMM通过最小化一个二次型目标函数来实现:Qn(θ)=gˉn(θ)Wngˉn(θ)Q_n(\theta) = \bar{g}_n(\theta)' W_n \bar{g}_n(\theta)。GMM估计量θ^GMM\hat{\theta}_{GMM}就是最小化该目标函数的值。其中WnW_nq×qq \times q的权重矩阵,必须是正定矩阵。不同权重矩阵产生不同的GMM估计量,但只要WnW_n收敛到正定矩阵WW,所有估计量都是一致的。

为了获得最有效的估计,需要选择最优权重矩阵——即样本矩向量渐近协方差矩阵的逆:WoptW_{opt}正比于S1S^{-1},其中S=AsyVar(ngˉn(θ0))S = \text{AsyVar}(\sqrt{n} \bar{g}_n(\theta_0))。实际操作中采用两步GMM:第一步使用单位矩阵作为权重得到初始一致估计量θ^(1)\hat{\theta}_{(1)};第二步利用θ^(1)\hat{\theta}_{(1)}构造最优权重矩阵的一致估计S^\hat{S}(在存在异方差序列相关时需使用HAC估计量如Newey-West),以W^n(2)=S^1\hat{W}_n^{(2)} = \hat{S}^{-1}再次最小化目标函数得到更有效的估计量。

性质与检验

在标准正则性条件下,GMM估计量具有一致性和渐近正态性。对于使用最优权重矩阵的有效GMM估计量,n(θ^GMMθ0)dN(0,V)\sqrt{n}(\hat{\theta}_{GMM} - \theta_0) \xrightarrow{d} N(0, V),其渐近协方差矩阵为V=(GS1G)1V = (G'S^{-1}G)^{-1},其中G=E[θg(Yi,θ0)]G = E[\nabla_\theta g(Y_i, \theta_0)]是矩条件函数对参数的梯度矩阵的期望。

GMM框架下最重要的检验是过度识别检验(J检验或Sargan-Hansen检验)。当模型被过度识别时,可以检验矩条件本身的有效性。J统计量定义为J=nQn(θ^GMM)J = n \cdot Q_n(\hat{\theta}_{GMM})。在所有矩条件均有效的原假设下,J统计量渐近服从自由度为qpq-p卡方分布。如果J统计量很大,p值小于显著性水平,则有理由拒绝原假设,认为模型设定有误。

与其他估计方法的关系

GMM是一个统一的框架。对于线性模型yi=xiβ+uiy_i = x_i'\beta + u_i,OLS的核心假设E[xiui]=0E[x_i u_i] = 0可写成矩条件E[xi(yixiβ)]=0E[x_i(y_i - x_i'\beta)] = 0,这是恰好识别的情况,得到的GMM估计量就是OLS估计量。当存在内生变量时,引入工具变量ziz_i后的矩条件E[zi(yixiβ)]=0E[z_i(y_i - x_i'\beta)] = 0:工具变量数量等于内生变量数量时GMM等价于标准IV;工具变量数量多于内生变量时GMM等价于两阶段最小二乘法(2SLS),在存在异方差时两步GMM比2SLS更有效。MLE的一阶条件要求得分函数的期望为零,这组条件可以直接用作GMM的矩条件,基于此的GMM估计量就是MLE估计量。

GMM的主要优点包括普适性强(可应用于广泛的线性和非线性模型)、对数据分布假设要求较少(不要求正态性,使用HAC权重矩阵时对异方差和序列相关稳健)、两步GMM在所有使用相同矩条件信息的估计量中是渐近最有效的。主要缺点包括小样本中可能表现不佳(估计量可能存在较大偏差)、表现严重依赖于所选矩条件的质量(弱工具变量问题会导致结果不可靠)、两步法中对权重矩阵的估计会引入额外抽样误差并可能加剧小样本偏差。