无约束模型
无约束模型 (unrestricted model 或 unconstrained model)是计量经济学假设检验框架中的核心概念,指不施加待检验约束条件的模型。与之对应的是受约束模型 (restricted model),即根据原假设对参数施加限制后得到的模型。在经典检验理论中,几乎所有基于比较的检验——F检验 、似然比检验 (LR)、Wald检验 和拉格朗日乘数检验 (LM)——都建立在无约束模型与受约束模型的对比之上。
考虑线性回归模型:
y = X β + ε , ε ∼ N ( 0 , σ 2 I ) \mathbf{y} = \mathbf{X}\boldsymbol{\beta} + \boldsymbol{\varepsilon}, \quad \boldsymbol{\varepsilon} \sim N(\mathbf{0}, \sigma^2 \mathbf{I}) y = X β + ε , ε ∼ N ( 0 , σ 2 I )
其中 β ∈ R k \boldsymbol{\beta} \in \mathbb{R}^k β ∈ R k 是参数向量。无约束模型指对 β \boldsymbol{\beta} β 不做任何形式限制的完整模型,因此其参数空间为整个 R k \mathbb{R}^k R k 。原假设 H 0 : R β = r H_0: \mathbf{R}\boldsymbol{\beta} = \mathbf{r} H 0 : R β = r (其中 R \mathbf{R} R 是 q × k q \times k q × k 秩为 q q q 的约束矩阵)对参数施加了 q q q 个线性约束。受约束模型是在服从 H 0 H_0 H 0 的前提下估计的模型,其有效参数空间维度为 k − q k-q k − q 。
无约束模型与受约束模型的形式化
令 β ^ U \hat{\boldsymbol{\beta}}_U β ^ U 为无约束模型的 OLS 估计量,β ^ R \hat{\boldsymbol{\beta}}_R β ^ R 为受约束模型的 OLS 估计量。无约束估计量直接最小化残差平方和:
β ^ U = ( X ′ X ) − 1 X ′ y \hat{\boldsymbol{\beta}}_U = (\mathbf{X}'\mathbf{X})^{-1}\mathbf{X}'\mathbf{y} β ^ U = ( X ′ X ) − 1 X ′ y
受约束估计量则需在 R β = r \mathbf{R}\boldsymbol{\beta} = \mathbf{r} R β = r 的约束下求解最小化问题,其显式解为:
β ^ R = β ^ U − ( X ′ X ) − 1 R ′ [ R ( X ′ X ) − 1 R ′ ] − 1 ( R β ^ U − r ) \hat{\boldsymbol{\beta}}_R = \hat{\boldsymbol{\beta}}_U - (\mathbf{X}'\mathbf{X})^{-1}\mathbf{R}'[\mathbf{R}(\mathbf{X}'\mathbf{X})^{-1}\mathbf{R}']^{-1}(\mathbf{R}\hat{\boldsymbol{\beta}}_U - \mathbf{r}) β ^ R = β ^ U − ( X ′ X ) − 1 R ′ [ R ( X ′ X ) − 1 R ′ ] − 1 ( R β ^ U − r )
无约束模型的残差平方和记为 S S R U = ∑ i = 1 n ε ^ U , i 2 SSR_U = \sum_{i=1}^n \hat{\varepsilon}_{U,i}^2 SS R U = ∑ i = 1 n ε ^ U , i 2 ,受约束模型的残差平方和记为 S S R R = ∑ i = 1 n ε ^ R , i 2 SSR_R = \sum_{i=1}^n \hat{\varepsilon}_{R,i}^2 SS R R = ∑ i = 1 n ε ^ R , i 2 。由于受约束模型在更小的参数空间内优化,必然有 S S R R ≥ S S R U SSR_R \geq SSR_U SS R R ≥ SS R U ——施加约束永远不会改善拟合,只会使之保持不变或变差。两者的差异 S S R R − S S R U SSR_R - SSR_U SS R R − SS R U 衡量了约束所造成的拟合损失,是所有基于比较的检验统计量的基础。
检验理论中的核心角色
F检验 直接以无约束模型与受约束模型的残差平方和之差构建统计量:
F = ( S S R R − S S R U ) / q S S R U / ( n − k ) ∼ F ( q , n − k ) under H 0 F = \frac{(SSR_R - SSR_U)/q}{SSR_U/(n-k)} \sim F(q, n-k) \quad \text{under } H_0 F = SS R U / ( n − k ) ( SS R R − SS R U ) / q ∼ F ( q , n − k ) under H 0
若原假设为真,约束不应造成显著的拟合损失,因此 F F F 值应按 F ( q , n − k ) F(q, n-k) F ( q , n − k ) 分布适度波动。若 F F F 值异常大,表明约束严重损害了模型的解释能力,从而拒绝原假设。这是计量经济学中最常用的线性约束检验方法,几乎出现在每一篇实证论文的回归表格中——模型整体显著性检验 (H 0 H_0 H 0 :除截距外所有斜率系数为零)便是其最常见的特殊形式。
似然比检验 (Likelihood Ratio Test, LR)在极大似然框架下比较两个模型:
L R = 2 [ ln L ( β ^ U ) − ln L ( β ^ R ) ] → d χ 2 ( q ) under H 0 LR = 2[\ln L(\hat{\boldsymbol{\beta}}_U) - \ln L(\hat{\boldsymbol{\beta}}_R)] \xrightarrow{d} \chi^2(q) \quad \text{under } H_0 L R = 2 [ ln L ( β ^ U ) − ln L ( β ^ R )] d χ 2 ( q ) under H 0
无约束模型的对数似然 ln L ( β ^ U ) \ln L(\hat{\boldsymbol{\beta}}_U) ln L ( β ^ U ) 总是大于等于受约束的对数似然。LR 检验考察这一差异是否在统计上显著。在正态线性回归中,LR 统计量是 F F F 统计量的单调变换,两者渐近等价。
Wald检验 的思路不同:它仅在无约束模型下进行估计,然后直接检验约束条件 R β = r \mathbf{R}\boldsymbol{\beta} = \mathbf{r} R β = r 在无约束估计值上是否近似成立:
W = ( R β ^ U − r ) ′ [ R V a r ^ ( β ^ U ) R ′ ] − 1 ( R β ^ U − r ) → d χ 2 ( q ) W = (\mathbf{R}\hat{\boldsymbol{\beta}}_U - \mathbf{r})' [\mathbf{R} \widehat{\mathrm{Var}}(\hat{\boldsymbol{\beta}}_U) \mathbf{R}']^{-1} (\mathbf{R}\hat{\boldsymbol{\beta}}_U - \mathbf{r}) \xrightarrow{d} \chi^2(q) W = ( R β ^ U − r ) ′ [ R Var ( β ^ U ) R ′ ] − 1 ( R β ^ U − r ) d χ 2 ( q )
Wald 检验的优势在于只需估计无约束模型——当受约束模型难以估计(例如约束是非线性的)时尤其方便。其劣势是对参数化的非线性变换不稳健,并且在小样本中可能过度拒绝。
拉格朗日乘数检验 (Lagrange Multiplier Test, LM,也称 Score Test)则只需估计受约束模型,考察受约束估计下的梯度(得分)是否接近于零:
L M = s ( β ^ R ) ′ I ( β ^ R ) − 1 s ( β ^ R ) → d χ 2 ( q ) LM = \mathbf{s}(\hat{\boldsymbol{\beta}}_R)' \mathbf{I}(\hat{\boldsymbol{\beta}}_R)^{-1} \mathbf{s}(\hat{\boldsymbol{\beta}}_R) \xrightarrow{d} \chi^2(q) L M = s ( β ^ R ) ′ I ( β ^ R ) − 1 s ( β ^ R ) d χ 2 ( q )
其中 s ( ⋅ ) \mathbf{s}(\cdot) s ( ⋅ ) 是得分向量(对数似然的梯度),I ( ⋅ ) \mathbf{I}(\cdot) I ( ⋅ ) 是信息矩阵。如果约束正确,约束最优解应接近无约束最优解,得分应接近零。LM 检验在只需估计简单受约束模型即可检验复杂无约束备择的场景中特别有用——Breusch-Pagan检验 和 Breusch-Godfrey检验 (自相关检验)就是 LM 检验的著名特例。
无约束模型与模型选择
无约束模型不总是好的。在模型选择中,"无约束"意味着参数最多、拟合最优——但它也面临过拟合 的风险。一个包含大量无关变量的无约束模型虽然样本内 R 2 R^2 R 2 更高,样本外预测能力却可能更差。这正是AIC (赤池信息准则)、BIC (贝叶斯信息准则)等信息准则试图平衡的张力:
AIC = − 2 ln L + 2 k , BIC = − 2 ln L + k ln n \text{AIC} = -2\ln L + 2k, \quad \text{BIC} = -2\ln L + k\ln n AIC = − 2 ln L + 2 k , BIC = − 2 ln L + k ln n
无约束模型的似然值更高(第一项更小),但参数数量 k k k 更大(第二项惩罚更重)。模型选择准则在拟合与简约之间寻求最优——一个更紧的受约束模型可能同时具有更低的 AIC,表明约束不仅简洁,而且合理。
经典应用场景
结构性变化的 Chow 检验 是无约束/受约束模型的教科书式应用。原假设为两个时期(或两个群体)的回归系数相同。受约束模型在全样本上估计,无约束模型分别对两个子样本估计——后者的残差平方和是两组残差平方和之和:S S R U = S S R 1 + S S R 2 SSR_U = SSR_1 + SSR_2 SS R U = SS R 1 + SS R 2 。Chow 统计量的分子捕捉了分组建模带来的拟合改善。
变量冗余检验 (test of overidentifying restrictions)是另一个典型场景。在包含 k k k 个变量的无约束模型中,若要检验其中 q q q 个变量是否冗余(系数联合为零),受约束模型即排除这 q q q 个变量后重新估计。标准的 F 统计量和所有三大检验(Wald, LR, LM)均可用于此场景。
工具变量 过度识别检验 (Sargan-Hansen J 检验)同样依赖这一框架:受约束模型是恰好识别(工具变量数等于内生变量数),无约束模型是过度识别。检验考察额外矩条件是否显著偏离零——即额外工具是否与结构误差正交。
非线性约束与广义无约束模型
前述讨论集中于线性约束,但无约束模型的概念自然扩展到非线性约束。若 H 0 : g ( β ) = 0 H_0: g(\boldsymbol{\beta}) = \mathbf{0} H 0 : g ( β ) = 0 (其中 g : R k → R q g: \mathbb{R}^k \to \mathbb{R}^q g : R k → R q 光滑),受约束估计需在非线性约束下进行数值优化,而 Wald、LR 和 LM 检验仍以无约束模型为基准——只需用 ∇ g ( β ^ ) \nabla g(\hat{\boldsymbol{\beta}}) ∇ g ( β ^ ) 替代线性约束矩阵 R \mathbf{R} R 。三者在小样本下给出不同结论是常见的,这正是它们各自对参数化敏感性的体现。
在广义矩估计 (GMM)中,无约束模型对应矩条件恰好多于参数个数的设定(过度识别),其目标函数在最优加权矩阵下的最小值即为 Hansen J 统计量,用来检验过度识别约束的有效性。此时"无约束"与"受约束"的对比不再通过残差平方和度量,而是通过 GMM 准则函数的差异加以刻画。
实践指南
在实际计量工作中,无约束模型的估计是先决步骤——它提供了不受限制的基准拟合,所有后续检验皆以此为参照。然而,无约束模型本身并非免于诊断:它同样需要经受异方差性 检验、多重共线性 诊断、残差分析 等标准检验。一个拟合优异的无约束模型若存在未被诊断的设定偏误,所有基于它构建的约束检验也同样不可靠。计量经济学中有一条隐含的工作流程:先建立可信的无约束基准,再以此为基础考察约束的合理性——两者顺序不可颠倒,否则检验就成了循环论证。
关于知经 KNOWECON
知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌,长期面向北京大学、清华大学、中国人民大学等顶尖院校,提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考,并成功进入理想院校。
知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业,获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者,长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。
我们相信,好的考研辅导不只是押题和陪跑,更是把复杂知识讲清楚、把复习路径设计清楚,并用技术让学习过程更可追踪、更可反馈、更可坚持。