多元线性回归模型 (MLR)
描述因变量Y与k≥2个自变量间线性关系的统计/计量经济学最广用模型。核心:量化各自变量对Y的独立影响并预测。总体模型:Y=β0+β1X1+⋯+βkXk+ϵ。βj为偏回归系数→控制其他变量不变(ceteris paribus)下Xj每增一单位Y期望均变量。ϵ=误差项→非模型解释的其他因素总和。样本回归函数:Y^=β^0+β^1X1+…。
OLS估计
普通最小二乘法OLS→最小化残差平方和SSR=∑(yi−y^i)2。矩阵解:y=Xβ+ϵ→β^=(X′X)−1X′y。
CLRM假设与Gauss-Markov
经典线性回归CLRM七假设:①参数线性;②随机抽样;③无完全多重共线性(任自变量非其他的精确线性组合→否则X′X奇→无法求逆);④零条件均值(E(ϵ∣X)=0)→核心→确保无偏→违反即内生性;⑤同方差性(Var(ϵ∣X)=σ2常数→违即异方差);⑥无自相关(Cov(ϵi,ϵj)=0,i=j→序列相关→时间序列重要);⑦正态性(ϵ∼N(0,σ2)→小样本假设检验/CI需→大样本CLT可放宽)。
满足1-5(截面)/1-6(时间序列)→高斯-马尔可夫定理:OLS=最小方差线性无偏→BLUE。
模型评估
判定系数R2:ESS/TSS=1-SSR/TSS→Y总变异中被模型解释的百分比→0-1越大越好→但随自变量增单调不减(加无关变量亦升)。调整后R2:惩罚多无关变量→更公充模型比较。F检验:H0:β1=⋯=βk=0→整体线性关系显著否。t检验:H0:βj=0→单个变量显著否→t=β^j/se(β^j)。
常见问题:多重共线性→方差膨胀因子VIF诊断→系数标准误大→估不稳但不破无偏;遗漏变量偏误(漏与Y相关+与含X相关的变量→OLS有偏不一致→核心问题);异方差→OLS仍无偏但不再BLUE→常规标准误失效→t/F不可靠→用稳健标准误或加权最小二乘法WLS。