古典线性回归模型 (Classical Linear Regression Model)
古典线性回归模型 (Classical Linear Regression Model, CLRM) 是 计量经济学 的基石,由 普通最小二乘法 (Ordinary Least Squares, OLS) 框架下的线性 回归分析 构成。它研究一个 因变量 Y 与一个或多个 自变量 X1,X2,…,Xk 之间的线性关系,是经济学实证研究的核心工具。
模型设定
对于 n 个观测值,总体回归模型为:
Yi=β0+β1X1i+β2X2i+⋯+βkXki+εi,i=1,2,…,n
其中 β0 为截距项,βj(j=1,…,k)为斜率参数,衡量自变量 Xj 对 Y 的边际效应;εi 为 随机误差项,捕捉模型未包含的所有因素。用矩阵表示为:
y=Xβ+ε
高斯-马尔可夫假定
OLS 估计量具有优良统计性质的前提是以下 高斯-马尔可夫假定 (Gauss-Markov Assumptions):
- 线性性:模型对参数 β 是线性的,即 Y=Xβ+ε。
- 严格外生性:E(εi∣X)=0,误差项与所有自变量的任意观测值不相关。
- 无完全多重共线性:X 列满秩,即 rank(X)=k+1,自变量之间不存在精确线性关系。
- 球面误差方差:Var(εi∣X)=σ2(同方差性),且 Cov(εi,εj∣X)=0(无 自相关)。
- 正态性(可选):εi∣X∼N(0,σ2),用于有限样本下的 假设检验 与 置信区间 构造。
OLS 估计
OLS 通过最小化残差平方和求解 β:
β^mini=1∑n(Yi−xi′β^)2=(y−Xβ^)′(y−Xβ^)
一阶条件给出正规方程 X′Xβ^=X′y,解为:
β^=(X′X)−1X′y
在假定 1--4 下,OLS 估计量是 线性无偏的:E(β^∣X)=β,且方差-协方差矩阵为:
Var(β^∣X)=σ2(X′X)−1
高斯-马尔可夫定理
高斯-马尔可夫定理 断言:在假定 1--4 下,OLS 估计量是 最佳线性无偏估计量 (Best Linear Unbiased Estimator, BLUE)。即对于参数 β 的任意线性组合 c′β,在所有线性无偏估计量中,OLS 估计量 c′β^ 具有最小方差。这一定理确立了 OLS 在古典框架下的最优性,是计量理论的里程碑。
拟合优度与模型诊断
决定系数 R2 衡量模型对数据的拟合程度:
R2=1−∑i=1n(Yi−Yˉ)2∑i=1nε^i2=1−SSTSSR
其中 ε^i=Yi−xi′β^ 为残差。R2∈[0,1],越接近 1 表明拟合越好,但增加自变量会使 R2 机械上升,因此常用 调整 R2(Rˉ2)进行自由度修正。
对方差 σ2 的无偏估计为 σ^2=n−k−11∑i=1nε^i2。
假设检验
在假定 5(正态性)下,可构造如下检验:
- 单个系数检验:H0:βj=0 的 t 检验,统计量 t=β^j/SE(β^j)∼tn−k−1。
- 联合检验:H0:β1=β2=⋯=βk=0 的 F 检验,统计量 F=(1−R2)/(n−k−1)R2/k∼Fk,n−k−1。
- 线性约束检验:检验多个线性约束(如 β1=β2),通过比较受约束与无约束模型的残差平方和构造 F 统计量。
违背假定的后果
古典假定在实践中常被违背:
- 异方差性:Var(εi∣X)=σ2,此时 OLS 仍无偏但不再有效,标准误有偏。解决方案包括 怀特稳健标准误 或 加权最小二乘法 (WLS)。
- 自相关:Cov(εi,εj)=0,常见于 时间序列数据。OLS 标准误有偏,需使用 Newey-West 标准误 或 广义最小二乘法 (GLS)。
- 多重共线性:自变量间高度相关(虽非完全共线),导致 Var(β^j) 膨胀,系数估计不稳定。可通过 方差膨胀因子 (VIF) 诊断。
经济学应用
古典线性回归模型广泛应用于经济学各领域:
- 劳动经济学:估计教育回报率——ln(wage)=β0+β1educ+β2exper+ε,其中 β1 衡量每增加一年教育带来的工资百分比变化。
- 消费函数:凯恩斯消费函数 C=β0+β1Y+ε,β1 为 边际消费倾向。
- 资产定价:CAPM 中 β 系数的估计——Ri−Rf=α+β(Rm−Rf)+ε,β 衡量资产 i 的系统性风险。
- 政策评估:通过 双重差分法 (DiD) 的回归形式 Y=β0+β1Treat+β2Post+β3Treat×Post+ε,β3 捕捉政策处理效应。
古典线性回归模型是理解现代计量方法(如 工具变量法、面板数据模型、断点回归)的逻辑起点,掌握其假定、推导与诊断是深入学习 计量经济学 的必要基础。