ARTICLE

连续更新GMM

连续更新GMM(Continuously Updated GMM,CUE-GMM)是广义矩估计(GMM)框架中的一种重要估计策略,由汉森(Hansen)、希顿(Heaton)和亚龙(Yaron)于1996年系统提出。与标准的两步GMM不同,连续更新GMM的核心特征在于将权重矩阵视为待估参数的函数,在最小化过程中对权重矩阵与参数向量同时进行连续迭代,直至收敛。

浏览 0 更新 2025-11-11

连续更新GMM(Continuously Updated GMM,CUE-GMM)是广义矩估计(GMM)框架中的一种重要估计策略,由汉森(Hansen)、希顿(Heaton)和亚龙(Yaron)于1996年系统提出。与标准的两步GMM不同,连续更新GMM的核心特征在于将权重矩阵视为待估参数的函数,在最小化过程中对权重矩阵与参数向量同时进行连续迭代,直至收敛。这一方法在有限样本性质、弱识别情境下的稳健性以及数值稳定性方面具有独特优势,成为现代计量经济学工具箱中的重要组成部分。

估计原理与构造

在标准GMM框架中,设gt(θ) g_t(\theta) m m 维矩条件向量,满足总体矩条件E[gt(θ0)]=0 E[g_t(\theta_0)] = 0 。GMM估计量通过最小化以下目标函数获得:

QT(θ)=[1Tt=1Tgt(θ)]WT(θ)[1Tt=1Tgt(θ)]Q_T(\theta) = \left[\frac{1}{T}\sum_{t=1}^T g_t(\theta)\right]' W_T(\theta) \left[\frac{1}{T}\sum_{t=1}^T g_t(\theta)\right]

在两步GMM中,权重矩阵WT W_T 的选取分两步完成:首先使用一个初始权重矩阵(如单位矩阵)获得一致但非有效的估计量θ~ \tilde{\theta} ,然后基于θ~ \tilde{\theta} 计算最优权重矩阵W^T=S^1 \hat{W}_T = \hat{S}^{-1} (其中S^ \hat{S} 是矩条件的协方差矩阵的一致估计),最后以此固定权重矩阵重新估计θ \theta

连续更新GMM则取消了这一分步程序:它将权重矩阵直接构造为参数θ \theta 的函数WT(θ)=S^(θ)1 W_T(\theta) = \hat{S}(\theta)^{-1} ,其中S^(θ) \hat{S}(\theta) 是在给定θ \theta 下对矩条件长期协方差矩阵的估计。目标函数变为:

QTCUE(θ)=[1Tt=1Tgt(θ)]S^(θ)1[1Tt=1Tgt(θ)]Q_T^{\text{CUE}}(\theta) = \left[\frac{1}{T}\sum_{t=1}^T g_t(\theta)\right]' \hat{S}(\theta)^{-1} \left[\frac{1}{T}\sum_{t=1}^T g_t(\theta)\right]

估计量θ^CUE \hat{\theta}_{\text{CUE}} 通过直接最小化上述目标函数得出。在数值实现上,这一最小化通常需要借助迭代优化算法,因为参数θ \theta 同时出现在样本矩和权重矩阵之中,目标函数不再具有简单的二次型结构。

渐近性质

连续更新GMM估计量在标准正则条件下具有与最优两步GMM相同的渐近分布。具体而言,θ^CUE \hat{\theta}_{\text{CUE}} T \sqrt{T} -一致估计量,且满足:

T(θ^CUEθ0)dN(0,(GS1G)1)\sqrt{T}(\hat{\theta}_{\text{CUE}} - \theta_0) \xrightarrow{d} N(0, (G' S^{-1} G)^{-1})

其中G=E[gt(θ0)/θ] G = E[\partial g_t(\theta_0)/\partial \theta'] 为矩条件的期望导数矩阵,S=limTVar(TgˉT(θ0)) S = \lim_{T \to \infty} \text{Var}(\sqrt{T} \bar{g}_T(\theta_0)) 为矩条件的渐近方差协方差矩阵。这一结果表明,CUE在渐近意义下与最优两步GMM具有相同的效率,两者均达到半参数效率下界。

然而,CUE在有限样本中的表现往往显著优于两步GMM。这一优势主要源于两个方面:其一,CUE的目标函数对参数估计的误差更为"平滑",避免了两步估计中因权重矩阵的随机波动而产生的额外变异性;其二,CUE对矩条件的等距变换具有不变性,而两步GMM缺乏这一理想性质。

弱识别情境下的优势

连续更新GMM最引人注目的优势体现在弱识别(weak identification)情境中。当矩条件对参数的识别力度较弱时(即导数矩阵G G 接近秩亏缺),两步GMM的有限样本性质急剧恶化:估计量可能出现严重偏误,置信区间覆盖率远低于名义水平,过度识别检验的尺寸扭曲严重。相比之下,CUE在这一情境下表现出明显的稳健性。

这一差异的直觉在于:在弱识别条件下,两步GMM的权重矩阵估计误差与样本矩的波动相互耦合,导致目标函数在参数空间中产生虚假的最小值。而CUE通过将权重矩阵内生化于目标函数中,有效抑制了这种耦合效应。Stock和Wright(2000)以及Kleibergen(2005)的研究表明,基于CUE的识别检验(如Kleibergen的K统计量)在弱识别下具有正确的渐近尺寸,而标准的两步GMM过度识别检验则存在严重的尺寸扭曲。

与广义经验似然的关系

连续更新GMM与广义经验似然(Generalized Empirical Likelihood, GEL)估计量家族之间存在深刻的联系。GEL类估计量包括经验似然(Empirical Likelihood, EL)、指数倾斜经验似然(Exponential Tilting, ET)和连续更新GMM本身。事实上,CUE可被视为GEL框架中采用二次型准则函数的一个特例。Newey和Smith(2004)在统一的GEL框架下系统比较了这些估计量的高阶渐近性质,发现CUE在偏差项中不包含由矩条件非线性程度引起的额外成分,这一性质使其在某些情境下具有比经验似然更优的高阶偏差表现。

计算问题与发展

CUE在计算上面临比两步GMM更大的挑战。目标函数QTCUE(θ) Q_T^{\text{CUE}}(\theta) 可能具有多个局部极小值,且在弱识别区域中目标函数可能非常平坦,这对全局优化算法提出了较高要求。实际应用中通常采用以下策略:使用多个起始值进行全局搜索;结合两步GMM估计量作为初始值;利用剖面似然技巧降低优化维度。

近年来,连续更新GMM在资产定价、宏观经济学和劳动经济学等领域得到了广泛应用。在资产定价中,CUE常用于估计随机贴现因子模型的参数,因为这类模型通常面临矩条件众多而识别强度不足的问题;在宏观经济学中,CUE被应用于估计结构性消费资本资产定价模型和货币政策的泰勒规则。此外,CUE的思想也已拓展至面板数据模型和动态结构模型的估计中,成为处理弱识别问题的标准工具之一。

有限样本表现的比较

大量蒙特卡洛模拟研究对连续更新GMM与两步GMM的有限样本表现进行了系统比较。在矩条件数目较多而样本量有限的情形中,两步GMM的有限样本偏误随矩条件数量的增加而迅速增大,这一现象被称为"矩条件偏误"。CUE由于避免了权重矩阵的预估计误差积累,其偏误增长幅度明显更小。此外,在重尾分布或存在异常值的数据环境中,CUE的目标函数对极端观测值的敏感度较低,因而表现出更强的稳健性。