ARTICLE

线性模型

线性模型 (Linear Model) 线性模型是统计学和计量经济学中最基本、应用最广泛的建模框架。其核心假设是因变量 (Dependent Variable) 的期望值为一个或多个自变量 (Independent Variables) 的线性组合。线性模型以简洁的数学形式、清晰的经济学解释和优良的理论性质,成为所有实证研究者必须掌握的基础工具,也是理解更复

浏览 43 更新 2025-10-26

线性模型 (Linear Model)

线性模型统计学计量经济学中最基本、应用最广泛的建模框架。其核心假设是因变量 (Dependent Variable) 的期望值为一个或多个自变量 (Independent Variables) 的线性组合。线性模型以简洁的数学形式、清晰的经济学解释和优良的理论性质,成为所有实证研究者必须掌握的基础工具,也是理解更复杂模型不可或缺的出发点。

关键澄清:"线性"指模型关于参数 β\beta 线性,而非一定关于自变量 XX 线性。因此 Yi=β0+β1Xi2+εiY_i = \beta_0 + \beta_1 X_i^2 + \varepsilon_iYi=β0+β1lnXi+εiY_i = \beta_0 + \beta_1 \ln X_i + \varepsilon_i 均属线性模型——只要参数以加法形式进入方程、系数为常数即可。这一性质极大扩展了线性模型的适用范围,因为通过对变量做对数、平方项或交互项等变换,可以在线性框架内刻画丰富的非线性关系。

数学表述

线性模型的标准矩阵形式为:

Y=Xβ+εY = X\beta + \varepsilon

各组成部分如下:YYn×1n \times 1 因变量观测向量(亦称响应变量被解释变量);XXn×(p+1)n \times (p+1) 设计矩阵,首列恒为1以对应截距项 β0\beta_0,其余 pp 列对应各自变量;β=(β0,β1,,βp)\beta = (\beta_0, \beta_1, \ldots, \beta_p)' 为待估参数向量,是推断的核心对象;ε\varepsilonn×1n \times 1 误差项向量,汇总所有未进入模型的遗漏因素、测量误差与纯粹的随机扰动。

对单个观测 ii

Yi=β0+β1Xi1+β2Xi2++βpXip+εiY_i = \beta_0 + \beta_1 X_{i1} + \beta_2 X_{i2} + \cdots + \beta_p X_{ip} + \varepsilon_i

p=1p=1 时退化为简单线性回归——仅用一个自变量解释因变量,可通过散点图和回归直线直观呈现;p>1p>1 时为多元线性回归,是实证研究的标准配置,能够在"控制"其他变量不变的条件下分离出某一自变量的偏效应。

高斯-马尔可夫假定与BLUE性质

为使普通最小二乘法 (OLS) 得出的估计量具备优良统计性质,经典线性模型依赖以下高斯-马尔可夫假定

  1. 参数线性:模型关于 β\beta 线性,此为框架定义本身。
  2. 随机抽样{(Xi,Yi)}i=1n\{(X_i, Y_i)\}_{i=1}^n 从总体中独立随机抽取,保证样本代表性。
  3. 无完全共线性:自变量间不存在精确线性关系。若存在完全共线性,则 (XX)(X'X) 不可逆,无法求得唯一的 β^\hat{\beta}。实际研究中,虚拟变量陷阱(如同时放入男性和女性哑变量)是常见的共线性来源。
  4. 零条件均值E(εiXi1,,Xip)=0E(\varepsilon_i \mid X_{i1}, \ldots, X_{ip}) = 0。这是识别因果效应的最关键假定——它要求误差项中所有未观测因素在给定自变量的条件下均值为零,等价于误差与自变量不相关。一旦违反(如因遗漏变量偏误反向因果产生内生性),OLS估计量将不再一致,这是应用计量经济学面临的核心挑战。
  5. 同方差性Var(εiX)=σ2Var(\varepsilon_i \mid X) = \sigma^2 为常数,意味着误差的离散程度不随自变量变化。若方差随 XX 系统变化,则出现异方差性——此时OLS仍无偏且一致,但标准误有偏,导致t检验和F检验失效。实践中常使用异方差稳健标准误(Huber-White)加以应对。

在这五个假定下,高斯-马尔可夫定理断言:OLS估计量是最佳线性无偏估计量 (BLUE)——在所有关于 YY 线性且无偏的估计量中,OLS具有最小方差。这一定理奠定了OLS在经典计量理论中的核心地位。

若进一步增列正态性假定 εN(0,σ2I)\varepsilon \sim N(0, \sigma^2 I),则OLS估计量本身就是最大似然估计 (MLE),且在小样本下 β^\hat{\beta} 精确服从正态分布,为t检验和F检验提供严格依据。大样本下,中心极限定理使正态近似自动成立,此假定可放宽。

OLS估计与模型评估

OLS通过最小化残差平方和 (SSR) 求解参数:

minβ^i=1nei2=minβ^(YXβ^)(YXβ^)\min_{\hat{\beta}} \sum_{i=1}^n e_i^2 = \min_{\hat{\beta}} (Y - X\hat{\beta})'(Y - X\hat{\beta})

其中残差 ei=YiY^ie_i = Y_i - \hat{Y}_i 为观测值与拟合值之差。一阶条件给出正规方程 XXβ^=XYX'X\hat{\beta} = X'Y,解得:

β^=(XX)1XY\hat{\beta} = (X'X)^{-1}X'Y

此即OLS估计量的闭式解,其计算仅依赖数据的矩 (XX)(X'X)(XY)(X'Y),在样本量不大时极为便捷。

模型评估围绕三个维度展开:

  • 拟合优度决定系数 R2=1SSRTSSR^2 = 1 - \frac{SSR}{TSS} 衡量模型解释的变异比例,取值 [0,1][0,1]R2R^2 越接近1,模型拟合越好。但 R2R^2 随自变量增加而单调不减,因此引入调整 R2=1SSR/(np1)TSS/(n1)R^2 = 1 - \frac{SSR/(n-p-1)}{TSS/(n-1)} 以惩罚不必要的变量。
  • 系数解释与显著性β^j\hat{\beta}_j 的经济学含义是"在其他变量不变的条件下,XjX_j 每增加一个单位,YY 平均变动 β^j\hat{\beta}_j 个单位"。这一"其他条件不变" (ceteris paribus) 的解释是回归分析区别于简单相关的关键。对每个系数进行t检验 H0:βj=0H_0: \beta_j = 0,若p值小于显著性水平(通常0.05),则拒绝原假设、认为该变量在统计上显著。
  • 整体显著性:F检验联合检验 H0:β1=β2==βp=0H_0: \beta_1 = \beta_2 = \cdots = \beta_p = 0,即除截距外所有系数为零。若F统计量显著,说明模型整体具有解释力,但这不保证每个自变量都显著。

扩展与应用

线性模型是经济学实证研究的工作语言,典型应用场景包括:增长回归(GDP增长率对投资率、人力资本等回归)、劳动经济学(明瑟方程估计教育回报率)、金融学(资本资产定价模型 CAPM中资产超额收益对市场超额收益回归)、以及政策评估的双重差分法 (DID) 等。

当经典假定不满足时,线性模型可向以下方向拓展:

线性模型的力量恰在于它提供了一个透明、可解释且易于诊断的基准——在面对复杂现实之前,先理解线性世界,是每一位实证研究者的必要训练。