ARTICLE

多元线性回归模型

多元线性回归模型 (MLR) 描述因变量Y与k≥2个自变量间线性关系的统计/计量经济学最广用模型。核心:量化各自变量对Y的独立影响并预测。总体模型:Y= _0+ _1X_1+ + _kX_k+ 。 _j为偏回归系数→控制其他变量不变(ceteris paribus)下X_j每增一单位Y期望均变量。 =误差项→非模型解释的其他因素总和。样本回归函数: Y= _

浏览 37 更新 2025-10-23

多元线性回归模型 (MLR)

描述因变量Y与k≥2个自变量线性关系的统计/计量经济学最广用模型。核心:量化各自变量对Y的独立影响并预测。总体模型Y=β0+β1X1++βkXk+ϵY=\beta_0+\beta_1X_1+\dots+\beta_kX_k+\epsilonβj\beta_j偏回归系数控制其他变量不变(ceteris paribus)下XjX_j每增一单位Y期望均变量。ϵ\epsilon=误差项→非模型解释的其他因素总和。样本回归函数:Y^=β^0+β^1X1+\hat{Y}=\hat{\beta}_0+\hat{\beta}_1X_1+\dots

OLS估计

普通最小二乘法OLS→最小化残差平方和SSR=(yiy^i)2\sum(y_i-\hat{y}_i)^2。矩阵解:y=Xβ+ϵ\mathbf{y}=\mathbf{X}\boldsymbol{\beta}+\boldsymbol{\epsilon}β^=(XX)1Xy\hat{\boldsymbol{\beta}}=(X'X)^{-1}X'y

CLRM假设与Gauss-Markov

经典线性回归CLRM七假设:①参数线性;②随机抽样;③无完全多重共线性(任自变量非其他的精确线性组合→否则XXX'X奇→无法求逆);④零条件均值E(ϵX)=0E(\epsilon\mid X)=0)→核心→确保无偏→违反即内生性;⑤同方差性Var(ϵX)=σ2\mathrm{Var}(\epsilon\mid X)=\sigma^2常数→违即异方差);⑥无自相关Cov(ϵi,ϵj)=0,ijCov(\epsilon_i,\epsilon_j)=0,i\neq j→序列相关→时间序列重要);⑦正态性ϵN(0,σ2)\epsilon\sim N(0,\sigma^2)→小样本假设检验/CI需→大样本CLT可放宽)。

满足1-5(截面)/1-6(时间序列)→高斯-马尔可夫定理:OLS=最小方差线性无偏→BLUE

模型评估

判定系数R2R^2:ESS/TSS=1-SSR/TSS→Y总变异中被模型解释的百分比→0-1越大越好→但随自变量增单调不减(加无关变量亦升)。调整后R2R^2:惩罚多无关变量→更公充模型比较。F检验H0:β1==βk=0H_0:\beta_1=\dots=\beta_k=0→整体线性关系显著否。t检验H0:βj=0H_0:\beta_j=0→单个变量显著否→t=β^j/se(β^j)t=\hat{\beta}_j/se(\hat{\beta}_j)

常见问题:多重共线性方差膨胀因子VIF诊断→系数标准误大→估不稳但不破无偏;遗漏变量偏误(漏与Y相关+与含X相关的变量→OLS有偏不一致→核心问题);异方差→OLS仍无偏但不再BLUE→常规标准误失效→t/F不可靠→用稳健标准误加权最小二乘法WLS。