ARTICLE

受约束回归

受约束回归 (Constrained Regression) 受约束回归(Constrained Regression)是指在对回归系数施加特定限制的条件下进行最小二乘估计或最大似然估计的方法。这些约束可能源于经济理论(如生产函数的规模报酬不变)、政策分析(如预算分配的总和固定)或统计推断需求(如参数的线性等式或不等式限制)。相比无约束回归,受约束回归在更小

浏览 0 更新 2026-07-18

受约束回归 (Constrained Regression)

受约束回归(Constrained Regression)是指在对回归系数施加特定限制的条件下进行最小二乘估计最大似然估计的方法。这些约束可能源于经济理论(如生产函数的规模报酬不变)、政策分析(如预算分配的总和固定)或统计推断需求(如参数的线性等式或不等式限制)。相比无约束回归,受约束回归在更小的参数空间中寻找最优解,通常以牺牲拟合优度为代价换取参数的经济意义和理论一致性。

约束的数学表达与分类

受约束回归中的约束条件可按形式分为以下几类:

线性等式约束

这是最常见也最易于处理的约束类型,形如 Rβ=rR\beta = r,其中 RRq×kq \times k 矩阵,rrq×1q \times 1 向量,代表 qq 个独立线性约束。典型例子包括:

  • 系数归零:如检验某变量是否应从模型中剔除,约束为 βj=0\beta_j = 0
  • 系数相等:如检验两个变量的影响是否相同,约束为 βj=βk\beta_j = \beta_k
  • 线性组合为零:如Cobb-Douglas生产函数的规模报酬不变约束 β1+β2++βK=1\beta_1 + \beta_2 + \cdots + \beta_K = 1

线性不等式约束

形如 RβrR\beta \geq rRβrR\beta \leq r,常见于经济理论中的非负约束(如边际成本非负)或单调性约束(如需求曲线向下倾斜)。不等式约束的估计需使用二次规划算法,且估计量的渐近分布不再是简单的正态分布,而往往呈现"堆积"(堆积)特征。

非线性约束

约束为 g(β)=0g(\beta) = 0 的形式,其中 gg 为非线性函数。例如超越对数生产函数中的对称性约束。此类问题通常需借助数值优化方法求解,计算复杂度显著高于线性约束情形。

受约束最小二乘估计

线性等式约束的解析解

考虑线性回归模型 y=Xβ+εy = X\beta + \varepsilon,约束条件为 Rβ=rR\beta = r。受约束最小二乘(Restricted Least Squares, RLS)估计量的解析表达式为:

β^R=β^OLS(XX)1R[R(XX)1R]1(Rβ^OLSr)\hat{\beta}_R = \hat{\beta}_{OLS} - (X'X)^{-1}R'\big[R(X'X)^{-1}R'\big]^{-1}(R\hat{\beta}_{OLS} - r)

其中 β^OLS=(XX)1Xy\hat{\beta}_{OLS} = (X'X)^{-1}X'y 是通常的无约束最小二乘估计量。该公式具有清晰的解释:受约束估计量等于无约束估计量加上一个校正项,校正幅度取决于"约束偏离度" Rβ^OLSrR\hat{\beta}_{OLS} - r,即无约束估计偏离约束条件的程度。

RLS估计量的性质

在零假设 H0:Rβ=rH_0: R\beta = r 成立的条件下(即约束为真),RLS估计量具有以下重要性质:

  • 无偏性E[β^R]=βE[\hat{\beta}_R] = \beta,与OLS一致。
  • 方差减小Var(β^R)Var(β^OLS)\text{Var}(\hat{\beta}_R) \leq \text{Var}(\hat{\beta}_{OLS}) 在矩阵含义下成立。施加正确约束等同引入额外信息,因而降低了估计量的方差。
  • 均方误差的比较:若约束为真,RLS的均方误差严格小于OLS;若约束为假,RLS存在偏误,其均方误差可能大于OLS。
  • 有偏但更有效的权衡:这是受约束回归的核心思维——理论家接受了可能有偏的代价,换取在约束方向上的更高估计精度。

约束的检验:沃尔德检验

在受约束回归框架中,检验约束是否成立是最核心的推断问题之一。沃尔德检验(Wald Test)是一种仅需无约束估计的检验方法。其统计量为:

W=(Rβ^OLSr)[RVar^(β^OLS)R]1(Rβ^OLSr)W = (R\hat{\beta}_{OLS} - r)'\big[R\,\hat{\text{Var}}(\hat{\beta}_{OLS})\,R'\big]^{-1}(R\hat{\beta}_{OLS} - r)

在零假设和正态扰动假设下,WW 精确服从 F(q,nk)F(q, n-k) 分布。大样本下,qFdχ2(q)q \cdot F \xrightarrow{d} \chi^2(q)。沃尔德检验的直观意义:如果约束正确,Rβ^OLSrR\hat{\beta}_{OLS} - r 应接近零向量;若其显著偏离零,则拒绝约束的有效性。

相比之下,拉格朗日乘数检验(LM检验)仅需估计受约束模型,通过检验拉格朗日乘子是否显著非零来判断约束的合理性。似然比检验则需要同时估计受约束和无约束模型,比较两者的似然值差异。

受约束回归的经典应用

生产函数分析

在经济学的应用中,Cobb-Douglas生产函数的规模报酬不变(CRS)约束是受约束回归的经典案例。对于模型 lnY=β0+β1lnK+β2lnL+ε\ln Y = \beta_0 + \beta_1 \ln K + \beta_2 \ln L + \varepsilon,CRS约束为 β1+β2=1\beta_1 + \beta_2 = 1。施加约束后,可将模型改写为 ln(Y/L)=β0+β1ln(K/L)+ε\ln(Y/L) = \beta_0 + \beta_1 \ln(K/L) + \varepsilon,从而以人均形式估计。

需求系统的估计

在消费者理论中,斯卢茨基方程的对称性和齐次性约束通常通过受约束回归施加。例如在AIDS模型(Almost Ideal Demand System)中,需要同时施加加总性(\sum βi\beta_i = 1)、齐次性(\sum γij\gamma_{ij} = 0)和对称性(γij\gamma_{ij} = γji\gamma_{ji})三类约束。这些约束确保了估计结果与效用最大化理论的一致性。

套利限制与金融资产定价

在金融计量中,受约束回归常用于检验有效市场假说套利定价理论中的参数限制。例如在Fama-MacBeth两阶段估计中,第二阶段对风险溢价的估计需施加零-beta约束或MVP约束。

数值方法与计算考虑

对于线性等式约束,RLS有闭式解,计算上等价于OLS。对于不等式约束,常用二次规划(Quadratic Programming)方法,其核心是寻找满足所有不等式约束的最小化残差平方和的点。哈恩-乔丹分解(Householder-Jordan)和QR分解也是处理大规模约束问题的常用数值工具。

对于非线性约束,需使用广义矩估计(GMM)框架或非线性优化方法。拉格朗日函数方法在此处发挥关键作用:由 L=(yXβ)(yXβ)+λ(Rβr)\mathcal{L} = (y-X\beta)'(y-X\beta) + \lambda'(R\beta - r) 定义,其一阶条件给出了估计量及拉格朗日乘子 λ\lambda 的解。有趣的是,λ\lambda 的经济含义精确地度量了约束条件的"影子价格"——放松约束每单位所能带来的残差平方和减少量,这与拉格朗日乘数检验的内在逻辑完全一致。

局限性与注意事项

受约束回归虽用途广泛,但需谨慎使用。首先,错误施加的约束会产生估计偏误,导致推断失效。其次,约束过多或过于严格可能导致"过度拟合"理论而非数据。再次,对于靠近约束边界的数据,受约束估计量的分布可能严重偏离常规推断结论。因此,实践中通常建议进行约束的检验并报告相应的F统计量p值,以帮助判断约束的有效性。