ARTICLE

模型线性

模型线性 (Model Linearity) 模型线性是计量经济学与统计学中的基础概念,直接决定了可用的估计方法、推断工具及解释框架。在回归分析中,"线性"一词具有两种不同但常被混淆的含义:参数线性(Linearity in Parameters)与变量线性(Linearity in Variables)。区分这两种线性,是正确设定模型与解读实证结果的前提。

浏览 3 更新 2025-10-26

模型线性 (Model Linearity)

模型线性计量经济学统计学中的基础概念,直接决定了可用的估计方法、推断工具及解释框架。在回归分析中,"线性"一词具有两种不同但常被混淆的含义:参数线性(Linearity in Parameters)与变量线性(Linearity in Variables)。区分这两种线性,是正确设定模型与解读实证结果的前提。

参数线性:计量经济学的核心关切

在计量经济学中,当我们称一个回归模型是"线性的"时,几乎总是指它关于参数(Parameters)是线性的,而非关于解释变量是线性的。

一个通用形式的回归模型可写为:

Yi=f(X1i,X2i,,Xki;β1,β2,,βp)+uiY_i = f(X_{1i}, X_{2i}, \dots, X_{ki}; \beta_1, \beta_2, \dots, \beta_p) + u_i

其中 YiY_i 为因变量,XjiX_{ji} 为解释变量,βk\beta_k 为未知参数,uiu_i误差项。若该函数 ff 关于每一个 βk\beta_k 都是线性(一次)的——即每个参数仅以自身乘以某个已知函数的形式出现,且不同参数之间不存在乘积或嵌套关系——则该模型被称为参数线性模型

参数线性模型的一般形式可表示为:

Yi=β1Z1i+β2Z2i++βpZpi+uiY_i = \beta_1 Z_{1i} + \beta_2 Z_{2i} + \cdots + \beta_p Z_{pi} + u_i

其中每一个 ZjiZ_{ji} 都是原始解释变量 X1i,,XkiX_{1i}, \dots, X_{ki} 的已知函数(可包含常数 1,对应截距项),且函数形式中不包含任何未知参数。这意味着,尽管原始解释变量可以以任意非线性变换进入模型,但回归系数 βj\beta_j 始终以线性方式出现。

以下模型均属于参数线性模型:

  • 简单线性回归Yi=β0+β1Xi+uiY_i = \beta_0 + \beta_1 X_i + u_i——Z1=1Z_1 = 1Z2=XiZ_2 = X_i
  • 多项式回归Yi=β0+β1Xi+β2Xi2+β3Xi3+uiY_i = \beta_0 + \beta_1 X_i + \beta_2 X_i^2 + \beta_3 X_i^3 + u_i——Z1=1Z_1 = 1Z2=XiZ_2 = X_iZ3=Xi2Z_3 = X_i^2Z4=Xi3Z_4 = X_i^3
  • 对数模型lnYi=β0+β1lnXi+ui\ln Y_i = \beta_0 + \beta_1 \ln X_i + u_i——左侧因变量为 lnYi\ln Y_i,右侧 Z1=1Z_1 = 1Z2=lnXiZ_2 = \ln X_i
  • 含交互项的模型Yi=β0+β1X1i+β2X2i+β3(X1iX2i)+uiY_i = \beta_0 + \beta_1 X_{1i} + \beta_2 X_{2i} + \beta_3 (X_{1i} X_{2i}) + u_i——Z4=X1iX2iZ_4 = X_{1i} X_{2i},参数 β3\beta_3 依然以线性形式进入。
  • 指数变换模型Yi=β0+β1eXi+uiY_i = \beta_0 + \beta_1 e^{X_i} + u_i——Z2=eXiZ_2 = e^{X_i},关于参数依然是线性的。

参数线性之所以关键,根本原因在于普通最小二乘法(OLS)的理论基础——高斯-马尔可夫定理。在满足经典假设的条件下,OLS 估计量是最佳线性无偏估计量(BLUE)。OLS 的解析解 β^=(ZZ)1ZY\hat{\boldsymbol{\beta}} = (\mathbf{Z}'\mathbf{Z})^{-1}\mathbf{Z}'\mathbf{Y} 的存在性和唯一性依赖于参数线性结构。一旦参数非线性,闭式解即不复存在,估计转变为数值优化问题。

变量线性:更强的约束条件

变量线性(Linearity in Variables)要求因变量的条件期望不仅是参数的线性函数,同时也是每一个原始解释变量的线性函数。也就是说,模型中不允许出现 Xi2X_i^2lnXi\ln X_iX1iX2iX_{1i} X_{2i} 等变换项——每个解释变量仅以其原始的一次形式出现:

Yi=β0+β1X1i+β2X2i++βkXki+uiY_i = \beta_0 + \beta_1 X_{1i} + \beta_2 X_{2i} + \cdots + \beta_k X_{ki} + u_i

变量线性是参数线性的充分而非必要条件:所有变量线性的模型必然是参数线性的,但参数线性的模型不一定满足变量线性。在实际应用中,纯粹的变量线性假设过于严格,经济理论很少暗示两个变量之间的关系恰好是严格的线性关系——边际效用递减规模报酬变化、边际替代率递减等核心经济概念本质上都指向非线性关系。因此,计量经济学几乎从不要求模型关于变量线性,而只要求关于参数线性。多项式项、对数变换、交互项、虚拟变量的引入,都是在保留参数线性的前提下对变量非线性的灵活建模。

参数非线性模型

当模型无法被表示为参数线性形式时,它被称为参数非线性模型(Nonlinear in Parameters)。例如:

  • Yi=β0+eβ1Xi+uiY_i = \beta_0 + e^{\beta_1 X_i} + u_i——参数 β1\beta_1 出现在指数位置。
  • Yi=β01+β1eβ2Xi+uiY_i = \frac{\beta_0}{1 + \beta_1 e^{-\beta_2 X_i}} + u_i——逻辑增长曲线(Logistic Growth Curve),三个参数以非线性方式嵌套。
  • Yi=β0Xiβ1+uiY_i = \beta_0 X_i^{\beta_1} + u_i——幂函数形式,参数 β1\beta_1 为指数。
  • Yi=β0+β1X1iβ2X2iβ3+uiY_i = \beta_0 + \beta_1 X_{1i}^{\beta_2} X_{2i}^{\beta_3} + u_i——柯布-道格拉斯生产函数的加性误差形式,关于参数非线性。

对于参数非线性模型,OLS 的闭式解不再适用,必须借助非线性最小二乘法(NLS)或最大似然估计(MLE)进行数值迭代。常用算法包括高斯-牛顿法牛顿-拉弗森法莱文贝格-马夸特算法,从初始值出发迭代逼近最优解。

参数非线性带来若干挑战。第一,残差平方和函数可能不再全局凸,存在多个局部极小值,不同初始值可能收敛到不同结果。第二,标准误的计算不再有精确的小样本表达式,必须依赖渐近近似。第三,在线性模型中,β1\beta_1边际效应恒定且等于参数本身;在非线性模型中,边际效应是变量取值和参数的复合函数,解释需额外推演。

线性化变换:从非线性到线性

许多在原始形式上参数非线性的模型,可以通过恰当的数学变换转化为参数线性模型——前提是误差项的结构允许且变换后的误差项满足经典假设。这种策略在实证工作中被广泛使用。

最典型的例子是柯布-道格拉斯生产函数

Qi=AKiαLiβeuiQ_i = A K_i^{\alpha} L_i^{\beta} e^{u_i}

其中 QiQ_i 为产出,KiK_i 为资本投入,LiL_i 为劳动投入,A,α,βA, \alpha, \beta 为未知参数。原始形式关于参数 A,α,βA, \alpha, \beta 是非线性的(α\alphaβ\beta 作为指数出现)。但通过对两侧同时取自然对数,得到:

lnQi=lnA+αlnKi+βlnLi+ui\ln Q_i = \ln A + \alpha \ln K_i + \beta \ln L_i + u_i

β0=lnA\beta_0 = \ln A,则该模型转化为标准的参数线性模型,可直接使用 OLS 估计。参数 α\alphaβ\beta 分别直接给出了产出对资本和劳动的弹性(elasticity),这也使得对数线性形式在经济解释上比原始形式更为便利。

然而,线性化变换并非没有代价。变换后的模型要求误差项 uiu_i 满足同方差性正态性(若需进行有限样本推断)——这些假设在原模型(乘法误差)中成立,并不意味着变换前的加法误差模型中亦成立。研究者必须明确模型所基于的误差结构,并据此选择正确的函数形式和估计策略。此外,若原始数据的生成过程确实为加法误差(即 Qi=AKiαLiβ+viQ_i = A K_i^{\alpha} L_i^{\beta} + v_i),取对数后无法得到线性形式,只能诉诸 NLS。

另一类常见的线性化变换是Box-Cox变换,它为因变量(或同时为解释变量)引入一个变换参数 λ\lambda,通过数据驱动的方式选择使残差最接近正态分布的变换形式,在灵活性与可解释性之间寻求平衡。

线性假设的诊断与检验

在实际建模过程中,判断线性(尤其是参数线性)假设是否合理是模型诊断的重要环节。

残差图是最直观的工具:以拟合值 Y^i\hat{Y}_i 为横轴、残差 eie_i 为纵轴作图。若模型关于参数和变量均正确设定,残差应围绕零线随机散布,不呈现任何系统性模式。若残差图呈现 U 形或倒 U 形曲线,则可能暗示遗漏了二次项或存在更复杂的非线性结构。若残差图呈现喇叭形扩散,则可能指向异方差性而非非线性问题。

雷姆西 RESET 检验(Ramsey's Regression Equation Specification Error Test)是检验函数形式误设(包括非线性)最常用的正式检验。其步骤为:先估计原模型得到拟合值 Y^i\hat{Y}_i,然后在原模型中添加 Y^i2,Y^i3\hat{Y}_i^2, \hat{Y}_i^3 等高次项作为额外回归元,通过F检验检验这些新增项的联合显著性。若检验拒绝原假设(即新增项联合不显著),则表明原线性设定可能存在模型设定偏误,需重新审视函数形式。

对于参数非线性的正式检验,可采用拉格朗日乘数检验(LM Test)或其在大样本下等价的似然比检验。这些检验通过比较线性模型与非线性替代模型的拟合优度,来判断线性约束是否与数据相容。

线性与非线性的权衡

尽管参数非线性模型在理论上更具一般性,但在实践中,经济学家和统计学家通常优先考虑参数线性模型,仅在理论或数据强烈要求时才转向非线性设定。这一偏好的根由是多方面的:

  1. 计算便利性:OLS 具有解析解,计算成本几乎为零;NLS 和 MLE 则需要迭代算法,在大数据和高维设定下计算负担显著增加。
  2. 推断的精确性:线性模型下,OLS 估计量在满足高斯-马尔可夫假设时是 BLUE,具有精确的有限样本分布(在正态误差假设下,t 统计量和 F 统计量具有精确的 t 分布和 F 分布)。非线性模型的推断仅在大样本下渐进成立。
  3. 解释的直观性:线性模型中的回归系数直接给出了"在其他条件不变时,解释变量每变化一个单位,因变量的平均变化量"——这一边际效应解释简洁而普适。非线性模型中的边际效应随变量取值变化,需要以平均值或特定分位点的边际效应进行报告,增加了沟通成本。
  4. 稳健性:通过多项式项、对数变换、样条(Splines)、交互项等灵活手段,参数线性模型足以近似大量真实世界的非线性关系,且可在不牺牲 OLS 优良性质的前提下逼近高度复杂的函数形式。Stone-Weierstrass 定理从数学上保证了在一定条件下,任何连续函数均可被多项式(从而被参数线性模型)以任意精度逼近。

因此,模型线性——准确地说,参数线性——是计量经济学建模的默认框架。它不仅是数学便利,更是一种建模哲学:在简约性(奥卡姆剃刀)、可解释性与灵活性之间寻求最优平衡。