ARTICLE

模型设定检验

模型设定检验 (Model Specification Testing) 模型设定检验(Model Specification Testing)是计量经济学和统计学中用于评估统计模型是否被正确设定的系统性方法体系。正确设定的模型应当满足其全部核心假设——包括函数形式正确、无遗漏变量、无多余变量、扰动项满足高斯-马尔可夫定理的条件等。当任一假设被违背时,参数估

浏览 0 更新 2026-07-18

模型设定检验 (Model Specification Testing)

模型设定检验(Model Specification Testing)是计量经济学统计学中用于评估统计模型是否被正确设定的系统性方法体系。正确设定的模型应当满足其全部核心假设——包括函数形式正确、无遗漏变量、无多余变量、扰动项满足高斯-马尔可夫定理的条件等。当任一假设被违背时,参数估计可能失去一致性无偏性有效性,统计推断随之失效。模型设定检验的目标正是在模型构建过程中及早发现并诊断这些问题,为后续修正提供指引。该领域自二十世纪六十年代以来涌现出Ramsey RESET检验Hausman检验Breusch-Godfrey检验等经典方法,已成为现代应用计量经济学的标准配套工具。

设定误差的类型与后果

经典线性回归模型的框架出发,设定误差主要分为四大类型。第一类是遗漏相关变量——若真实模型包含解释变量 X2X_2 而估计模型将其排除,且 X2X_2X1X_1 相关,则 X1X_1 的系数将产生遗漏变量偏误。偏误方向由 X2X_2 系数符号及 X1X_1X2X_2 的相关性共同决定,且不会随样本量增大而消失,属于非一致估计。第二类是包含多余变量——纳入不应出现的无关变量,虽不损害无偏性和一致性,但会增大估计系数的方差,降低推断功效。第三类是错误的函数形式——将非线性关系误设为线性、忽略交互效应等,导致系统性偏误。第四类是结构性断点——参数在样本区间内并非恒定,忽视断点相当于对多个不同数据生成过程施加同一约束。

RESET检验 (Ramsey RESET Test)

Ramsey RESET检验(Regression Equation Specification Error Test)是检测函数形式设定的经典方法,由James Ramsey于1969年提出。其基本逻辑是:若函数形式正确,则拟合值 Y^\hat{Y} 的非线性变换不应有额外解释力。具体步骤:先对原始模型做OLS回归得到 Y^\hat{Y};再将 Y^2\hat{Y}^2Y^3\hat{Y}^3 等高次项作为额外回归元加入原方程;最后用 FF 检验或 nR2nR^2 检验评估这些高次项系数是否联合为零。零假设为函数形式正确。RESET检验的优势在于通用性——无需指定替代模型形式即可检测多种设定偏差;局限在于拒绝零假设时仅知存在问题,却无法确定应引入对数变换还是交叉项等具体修正方向。

拉格朗日乘数类设定检验

在模型设定诊断中,拉格朗日乘数检验(LM检验)因仅需估计受约束模型而成为最广泛使用的检验范式之一。

Breusch-Godfrey检验检测扰动项的序列相关。将OLS残差 u^t\hat{u}_t 对原始解释变量和 u^t1,,u^tp\hat{u}_{t-1}, \ldots, \hat{u}_{t-p} 做辅助回归,检验滞后残差系数是否联合为零。与Durbin-Watson检验相比,它可处理任意高阶自相关,且不要求解释变量严格外生。

Breusch-Pagan检验White检验检测异方差性。Breusch-Pagan检验将残差平方对所有解释变量回归;White检验进一步加入平方项和交叉项以检测更广泛的异方差形式。两者均以同方差为零假设。

Engle ARCH检验检测残差中是否存在自回归条件异方差效应。将残差平方 u^t2\hat{u}_t^2 对其自身滞后值回归,nR2nR^2 在零假设下服从 χ2(q)\chi^2(q)。该检验在金融计量经济学中是决定是否引入GARCH模型的标准前置诊断。

嵌套与非嵌套模型检验

对于嵌套模型(一个模型可通过约束简化为另一个),可直接使用 FF 检验、似然比检验沃尔德检验评估约束的合理性。三者大样本下渐近等价,有限样本中存在 WLRLMW \geq LR \geq LM 的数值关系。对于非嵌套模型(彼此不能通过约束转化),Davidson-MacKinnon J检验是代表性方法:将竞争模型 H2H_2 的拟合值 Y^2\hat{Y}_2 纳入 H1H_1 检验其系数是否显著;再互换角色。结果可能出现两者均被拒绝、均未被拒绝或仅其一被拒绝等情况。

结构变化检验

邹检验(Chow Test)是最经典的结构变化检验方法。它将样本划分为子样本,分别估计受约束模型(全样本)和无约束模型(子样本分别估计),通过 FF 统计量比较残差平方和是否存在显著差异。邹检验要求断点位置已知且各子样本量大于参数个数。当断点未知时,可使用Quandt似然比检验Bai-Perron检验等内生断点方法,后者允许同时存在多个未知断点。

Hausman设定检验

Hausman检验由Jerry Hausman于1978年提出,是设定检验领域最具方法论影响力的工具之一。其核心思想是:在零假设下,一致估计量 θ^0\hat{\theta}_0 和有效一致估计量 θ^1\hat{\theta}_1 应收敛于相同概率极限,两者之差渐近为零;在备择假设下,有效估计量失去一致性,两者之差趋于非零向量。统计量构造为:

H=(θ^1θ^0)[V^(θ^1)V^(θ^0)]1(θ^1θ^0)dχ2(k)H = (\hat{\theta}_1 - \hat{\theta}_0)'[\hat{V}(\hat{\theta}_1) - \hat{V}(\hat{\theta}_0)]^{-1}(\hat{\theta}_1 - \hat{\theta}_0) \xrightarrow{d} \chi^2(k)

面板数据中,Hausman检验被广泛用于判断应选固定效应模型还是随机效应模型:若个体效应与解释变量相关,随机效应估计不一致,应拒绝;反之,随机效应因更有效而成为首选。该检验也用于工具变量的内生性检验和嵌套Logit模型的IIA假设检验。

模型设定的实践策略

在实际研究中,模型设定检验是一个需要经济理论、领域知识和统计诊断有机结合的迭代优化过程。推荐策略:先依据理论构建基准模型;用RESET检验评估函数形式;对时间序列数据检验序列相关、单位根和ARCH效应;对截面数据用White检验诊断异方差;在面板数据中用Hausman检验选择效应模型。每次检验结果都应审慎解读——统计显著性需与经济学显著性结合,避免仅凭 pp 值机械决策。同时需警惕数据挖掘风险:多重检验会膨胀第一类错误概率,建议采用邦费罗尼校正虚假发现率控制加以修正。最终目标是在简洁性与拟合优度之间达成平衡,构建既具理论说服力又有实证可靠性的统计模型。