ARTICLE

OLS估计量的无偏性证明

OLS估计量的无偏性证明 无偏性指估计量的期望值等于总体参数真值,即E( ) = 。在多次重复抽样中,OLS估计值的平均值精确等于未知的总体参数。该性质是高斯-马尔可夫定理的基石,也是计量经济学理论的核心结论。 核心假设 证明仅需四个假设(SLR.1--4),不要求同方差性(SLR.5): SLR.1 参数线性:总体模型为y = _0 + _1 x_1 +

浏览 29 更新 2025-10-25

OLS估计量的无偏性证明

无偏性估计量期望值等于总体参数真值,即E(β^)=βE(\hat{\beta}) = \beta。在多次重复抽样中,OLS估计值的平均值精确等于未知的总体参数。该性质是高斯-马尔可夫定理的基石,也是计量经济学理论的核心结论。

核心假设

证明仅需四个假设(SLR.1--4),不要求同方差性(SLR.5):

SLR.1 参数线性:总体模型为y=β0+β1x1++βkxk+uy = \beta_0 + \beta_1 x_1 + \cdots + \beta_k x_k + u。矩阵形式:

y=Xβ+u\mathbf{y} = \mathbf{X}\beta + \mathbf{u}

其中y\mathbf{y}n×1n\times 1向量,X\mathbf{X}n×(k+1)n\times (k+1)矩阵,β\beta(k+1)×1(k+1)\times 1参数向量。

SLR.2 随机抽样:样本{(yi,Xi1,,Xik)}i=1n\{(y_i, X_{i1}, \dots, X_{ik})\}_{i=1}^n从总体随机抽取。

SLR.3 无完全共线性X\mathbf{X}列满秩,(XX)(\mathbf{X}'\mathbf{X})可逆,保证OLS有唯一解。

SLR.4 零条件均值E(uX)=0E(\mathbf{u} \mid \mathbf{X}) = \mathbf{0}。这是最关键的假设——排除解释变量与误差项的系统相关。满足此条件的变量称外生变量。该假设蕴含:E(u)=0E(\mathbf{u}) = \mathbf{0}E(Xu)=0E(\mathbf{X}'\mathbf{u}) = \mathbf{0}

矩阵形式的证明

OLS估计量的闭式解

β^=(XX)1Xy\hat{\beta} = (\mathbf{X}'\mathbf{X})^{-1}\mathbf{X}'\mathbf{y}

代入真实模型y=Xβ+u\mathbf{y} = \mathbf{X}\beta + \mathbf{u}(SLR.1)并展开:

β^=(XX)1X(Xβ+u)=(XX)1XXβ+(XX)1Xu=β+(XX)1Xu\begin{aligned} \hat{\beta} &= (\mathbf{X}'\mathbf{X})^{-1}\mathbf{X}'(\mathbf{X}\beta + \mathbf{u}) \\ &= (\mathbf{X}'\mathbf{X})^{-1}\mathbf{X}'\mathbf{X}\beta + (\mathbf{X}'\mathbf{X})^{-1}\mathbf{X}'\mathbf{u} \\ &= \beta + (\mathbf{X}'\mathbf{X})^{-1}\mathbf{X}'\mathbf{u} \end{aligned}

这表明OLS估计量 = 真值 + 抽样误差项(XX)1Xu(\mathbf{X}'\mathbf{X})^{-1}\mathbf{X}'\mathbf{u}

对两边取期望:

E(β^)=β+E[(XX)1Xu]E(\hat{\beta}) = \beta + E[(\mathbf{X}'\mathbf{X})^{-1}\mathbf{X}'\mathbf{u}]

利用迭代期望定律,先对X\mathbf{X}取条件期望:

E[(XX)1XuX]=(XX)1XE(uX)=0E[(\mathbf{X}'\mathbf{X})^{-1}\mathbf{X}'\mathbf{u} \mid \mathbf{X}] = (\mathbf{X}'\mathbf{X})^{-1}\mathbf{X}' E(\mathbf{u} \mid \mathbf{X}) = \mathbf{0}

无条件期望亦为零:E[(XX)1Xu]=0E[(\mathbf{X}'\mathbf{X})^{-1}\mathbf{X}'\mathbf{u}] = \mathbf{0}

E(β^)=βE(\hat{\beta}) = \beta。得证。

简单回归的特例

对于一元回归y=β0+β1x+uy = \beta_0 + \beta_1 x + u,斜率估计量:

β^1=β1+(xixˉ)ui(xixˉ)2\hat{\beta}_1 = \beta_1 + \frac{\sum (x_i - \bar{x})u_i}{\sum (x_i - \bar{x})^2}

xx为条件求期望,SLR.4使分子期望为零→E(β^1)=β1E(\hat{\beta}_1) = \beta_1。截距β^0=yˉβ^1xˉ\hat{\beta}_0 = \bar{y} - \hat{\beta}_1\bar{x},同理可证E(β^0)=β0E(\hat{\beta}_0) = \beta_0

结论与启示

无偏性意味着OLS平均而言正确——尽管单次估计几乎不可能等于真值,但不会系统性高估或低估。

SLR.4是所有证明的支点。若其不成立(如遗漏变量偏误样本选择偏误同期相关),抽样误差项期望非零→E(β^)βE(\hat{\beta}) \neq \beta→OLS有偏且不一致→错误推断。因此实证研究中,论证零条件均值的合理性是应用OLS的首要前提