ARTICLE

最佳线性无偏估计量

最佳线性无偏估计量 (Best Linear Unbiased Estimator) 最佳线性无偏估计量 (Best Linear Unbiased Estimator, 简称 BLUE) 是 统计学 和 计量经济学 中的一个核心概念,用于评价一个 估计量 (Estimator) 的优良性。若一个估计量被称为 BLUE,意味着它在 所有线性且无偏的估计量中具

浏览 72 更新 2025-10-26

最佳线性无偏估计量 (Best Linear Unbiased Estimator)

最佳线性无偏估计量 (Best Linear Unbiased Estimator, 简称 BLUE) 是 统计学计量经济学 中的一个核心概念,用于评价一个 估计量 (Estimator) 的优良性。若一个估计量被称为 BLUE,意味着它在 所有线性且无偏的估计量中具有最小的 方差 (Variance)。高斯-马尔可夫定理 (Gauss-Markov Theorem) 证明了在特定条件下,普通最小二乘法 (OLS) 估计量 就是 BLUE。

BLUE 的三个核心特质

线性 (Linear)

一个估计量若可以表示为 因变量 (Dependent Variable) 观测值的线性函数, 则称其为线性估计量。对于线性回归模型中的参数 β\beta,若估计量 β^\hat{\beta} 可写为:

β^=i=1nwiYi\hat{\beta} = \sum_{i=1}^{n} w_i Y_i

其中 YiY_i 是因变量的第 ii 个观测值,权重 wiw_i 仅由 解释变量 决定而不依赖于 YiY_i,则 β^\hat{\beta} 是线性的。例如在简单回归 Yi=β0+β1Xi+uiY_i = \beta_0 + \beta_1 X_i + u_i 中,OLS 斜率估计量可写为 β^1=wiYi\hat{\beta}_1 = \sum w_i Y_i,其中权重 wi=(XiXˉ)/(XjXˉ)2w_i = (X_i - \bar{X}) / \sum (X_j - \bar{X})^2,故 OLS 是线性估计量。

无偏 (Unbiased)

无偏性要求估计量的 期望值 等于所要估计的 总体参数 真实值:

E(β^)=βE(\hat{\beta}) = \beta

这并不意味着单次估计恰好等于真实值,而是指在重复抽样中估计值的均值将收敛于 真实参数,即估计量不会系统性偏高或偏低。在线性回归中,OLS 的无偏性依赖于 零条件均值假设 E(uX)=0E(u|X) = 0,即 误差项 与解释变量不相关。

最佳 (Best)

"最佳"在 BLUE 中特指 最小方差,即 效率 (Efficiency) 最优。 在所有满足线性和无偏条件的估计量中,BLUE 的方差最小:

Var(β^BLUE)Var(β~)\operatorname{Var}(\hat{\beta}_{\text{BLUE}}) \le \operatorname{Var}(\tilde{\beta})

方差越小,估计量围绕真实参数值的离散程度越低,估计结果越精确,可提供更窄的 置信区间 (Confidence Interval) 和更高统计效力的 假设检验

高斯-马尔可夫定理

高斯-马尔可夫定理是计量经济学的基石,它给出了 OLS 成为 BLUE 的充分条件: 在线性回归模型的经典假设下,OLS 估计量是最佳线性无偏估计量。这些经典假设包括:

  1. 模型参数线性Y=Xβ+uY = X\beta + u
  2. 随机抽样:样本来自总体的随机抽取。
  3. 解释变量存在变异:不存在完全的 多重共线性
  4. 零条件均值E(uX)=0E(u|X) = 0,保证无偏性。
  5. 同方差性Var(uX)=σ2\operatorname{Var}(u|X) = \sigma^2, 保证"最佳"(最小方差)。

BLUE 的理论意义

第一,BLUE 为 OLS 的广泛应用提供了理论依据:当高斯-马尔可夫假设成立时, OLS 是最理想的线性估计方法。第二,它指明了模型诊断的方向——若 异方差性 (Heteroskedasticity) 或 自相关 (Autocorrelation) 存在,OLS 虽仍线性 无偏,却不再是"最佳"的,此时应改用 广义最小二乘法 (GLS) 或稳健标准误。 理解 BLUE 是掌握线性模型理论和进阶计量经济学方法的出发点。