OLS估计量的无偏性证明
无偏性指估计量的期望值等于总体参数真值,即E(β^)=β。在多次重复抽样中,OLS估计值的平均值精确等于未知的总体参数。该性质是高斯-马尔可夫定理的基石,也是计量经济学理论的核心结论。
核心假设
证明仅需四个假设(SLR.1--4),不要求同方差性(SLR.5):
SLR.1 参数线性:总体模型为y=β0+β1x1+⋯+βkxk+u。矩阵形式:
y=Xβ+u
其中y是n×1向量,X是n×(k+1)矩阵,β是(k+1)×1参数向量。
SLR.2 随机抽样:样本{(yi,Xi1,…,Xik)}i=1n从总体随机抽取。
SLR.3 无完全共线性:X列满秩,(X′X)可逆,保证OLS有唯一解。
SLR.4 零条件均值:E(u∣X)=0。这是最关键的假设——排除解释变量与误差项的系统相关。满足此条件的变量称外生变量。该假设蕴含:E(u)=0且E(X′u)=0。
矩阵形式的证明
OLS估计量的闭式解:
β^=(X′X)−1X′y
代入真实模型y=Xβ+u(SLR.1)并展开:
β^=(X′X)−1X′(Xβ+u)=(X′X)−1X′Xβ+(X′X)−1X′u=β+(X′X)−1X′u
这表明OLS估计量 = 真值 + 抽样误差项(X′X)−1X′u。
对两边取期望:
E(β^)=β+E[(X′X)−1X′u]
利用迭代期望定律,先对X取条件期望:
E[(X′X)−1X′u∣X]=(X′X)−1X′E(u∣X)=0
无条件期望亦为零:E[(X′X)−1X′u]=0。
故E(β^)=β。得证。
简单回归的特例
对于一元回归y=β0+β1x+u,斜率估计量:
β^1=β1+∑(xi−xˉ)2∑(xi−xˉ)ui
以x为条件求期望,SLR.4使分子期望为零→E(β^1)=β1。截距β^0=yˉ−β^1xˉ,同理可证E(β^0)=β0。
结论与启示
无偏性意味着OLS平均而言正确——尽管单次估计几乎不可能等于真值,但不会系统性高估或低估。
SLR.4是所有证明的支点。若其不成立(如遗漏变量偏误、样本选择偏误或同期相关),抽样误差项期望非零→E(β^)=β→OLS有偏且不一致→错误推断。因此实证研究中,论证零条件均值的合理性是应用OLS的首要前提。