OLS估计量的方差计算
OLS估计量的方差衡量不同样本下估计值围绕真实值的波动程度——评估可靠性/精度的关键指标。基于高斯-马尔可夫假设(线性、随机抽样、自变量样本变异、零条件均值、同方差性、无序列相关)。
简单线性回归
模型:yi=β0+β1xi+ui。推导 β^1=β1+∑(xi−xˉ)ui/SSTx。
斜率方差(同方差性下):
Var(β^1)=∑(xi−xˉ)2σ2=SSTxσ2
误差方差 σ2↑→估计精度↓;SSTx↑(x越分散)→方差↓(估计更精确)。增加样本量 n 也增大 SSTx。
截距方差:
Var(β^0)=σ2(n1+SSTxxˉ2)
xˉ 离0越远→截距估计为外推→不确定性↑。
误差方差估计与标准误
σ2 的无偏估计:σ^2=∑u^i2/(n−k−1)(简单回归分母 n−2,对应自由度)。σ^ 为回归标准误(SER)。
标准误:se(β^1)=σ^/∑(xi−xˉ)2;se(β^0)=σ^2(1/n+xˉ2/SSTx)。标准误是假设检验(t检验)和置信区间的基础。
多元线性回归
矩阵形式:y=Xβ+u,β^=(X′X)−1X′y。方差-协方差矩阵:Var(β^∣X)=σ2(X′X)−1。对第 j 个斜率:
Var(β^j)=SSTj(1−Rj2)σ2
揭示多重共线性:当 xj 被其他解释变量高度拟合时 Rj2→1,方差急剧增大(方差膨胀)。方差膨胀因子 VIFj=1/(1−Rj2)。