ARTICLE

无偏的

无偏性 (Unbiasedness) 无偏性 (Unbiasedness),或称 不偏性,是统计学和计量经济学中评价一个估计量 (Estimator) 优良性的核心标准之一。它描述的是估计量在多次重复抽样中,其估计值的平均水平是否等于被估计的真实参数 (Parameter) 值。一个具有无偏性的估计量,被称为 无偏估计量 (Unbiased Estimato

浏览 37 更新 2025-10-26

无偏性 (Unbiasedness)

无偏性 (Unbiasedness),或称 不偏性,是统计学计量经济学中评价一个估计量 (Estimator) 优良性的核心标准之一。它描述的是估计量在多次重复抽样中,其估计值的平均水平是否等于被估计的真实参数 (Parameter) 值。一个具有无偏性的估计量,被称为 无偏估计量 (Unbiased Estimator)。

定义与理解

在统计推断中,我们通常无法观测到总体的真实参数(如总体均值 μ\mu总体方差 σ2\sigma^{2}),因此我们从总体中抽取一个样本 (Sample),并构造一个基于样本数据的函数来估计该未知参数。这个函数就是估计量。由于样本是随机抽取的,所以由样本计算出的估计量也是一个随机变量

无偏性的正式定义如下:

假设 θ\theta 是一个我们想要估计的未知总体参数,而 θ^\hat{\theta} 是基于样本数据构造的 θ\theta 的估计量。如果 θ^\hat{\theta}期望值 (Expected Value) 等于真实的参数值 θ\theta,那么我们就称 θ^\hat{\theta}θ\theta 的一个无偏估计量。

数学上表示为:

E[θ^]=θE[\hat{\theta}] = \theta

直观理解: 这个公式的含义是,如果我们能够从同一个总体中,反复抽取无数个相同大小的样本,并对每一个样本都计算一次估计值 θ^\hat{\theta},那么所有这些估计值的平均数将会精确地等于真实的参数值 θ\theta。无偏估计量在平均意义上是"准确的",它既不会系统性地高估(overestimate)真实参数,也不会系统性地低估(underestimate)真实参数。

估计量的偏误 (Bias)

与无偏性相对的概念是 偏误偏差 (Bias)。一个估计量的偏误定义为它的期望值与真实参数值之间的差异。

Bias(θ^)=E[θ^]θ\text{Bias}(\hat{\theta}) = E[\hat{\theta}] - \theta

据此定义:

  • 如果 Bias(θ^)=0\text{Bias}(\hat{\theta}) = 0,则 θ^\hat{\theta} 是一个 无偏估计量
  • 如果 Bias(θ^)>0\text{Bias}(\hat{\theta}) > 0,则称 θ^\hat{\theta} 存在 正向偏误向上偏误 (Upward Bias),意味着它平均而言会高估真实值。
  • 如果 Bias(θ^)<0\text{Bias}(\hat{\theta}) < 0,则称 θ^\hat{\theta} 存在 负向偏误向下偏误 (Downward Bias),意味着它平均而言会低估真实值。

经典示例

样本均值的无偏性

这是证明无偏性的最典型案例。设 X1,X2,,XnX_{1}, X_{2}, \ldots, X_{n} 是从一个具有未知总体均值 μ\mu 和总体方差 σ2\sigma^{2} 的总体中抽取的容量为 nn随机样本。我们使用样本均值 Xˉ\bar{X} 作为总体均值 μ\mu 的估计量:

μ^=Xˉ=1ni=1nXi\hat{\mu} = \bar{X} = \frac{1}{n} \sum_{i=1}^{n} X_{i}

为了检验其无偏性,我们计算其期望值:

E[Xˉ]=E[1ni=1nXi]=1ni=1nE[Xi](根据期望的线性性质)\begin{aligned} E[\bar{X}] &= E\left[ \frac{1}{n} \sum_{i=1}^{n} X_{i} \right] \\ &= \frac{1}{n} \sum_{i=1}^{n} E[X_{i}] \quad (\text{根据期望的线性性质}) \end{aligned}

由于每个样本观测值 XiX_{i} 都来自同一个总体,因此它们的期望值都是总体均值 μ\mu,即 E[Xi]=μE[X_{i}] = \mu

E[Xˉ]=1ni=1nμ=1n(nμ)=μE[\bar{X}] = \frac{1}{n} \sum_{i=1}^{n} \mu = \frac{1}{n} (n\mu) = \mu

因为 E[Xˉ]=μE[\bar{X}] = \mu,所以样本均值 Xˉ\bar{X} 是总体均值 μ\mu 的一个无偏估计量。

样本方差的偏误与修正

估计总体方差 σ2\sigma^{2} 的情况则更为微妙,也更清楚地展示了偏误的概念。一个直观的估计量是样本方差的"有偏形式":

Sn2=1ni=1n(XiXˉ)2S_{n}^{2} = \frac{1}{n} \sum_{i=1}^{n} (X_{i} - \bar{X})^{2}

然而,可以证明这个估计量是有偏的,其期望值为:

E[Sn2]=n1nσ2E[S_{n}^{2}] = \frac{n-1}{n} \sigma^{2}

由于 n1n<1\frac{n-1}{n} < 1,所以 E[Sn2]<σ2E[S_{n}^{2}] < \sigma^{2}。这意味着 Sn2S_{n}^{2} 存在向下偏误,它会系统性地低估真实的总体方差。这种偏误的根源在于计算离差时使用的是样本均值 Xˉ\bar{X} 而非未知的总体均值 μ\mu。使用 Xˉ\bar{X} 会使得样本离差平方和 (XiXˉ)2\sum (X_{i} - \bar{X})^{2} 天然地小于使用 μ\mu 时的离差平方和 (Xiμ)2\sum (X_{i} - \mu)^{2}

为了修正这个偏误,我们引入 无偏样本方差,通常记为 s2s^{2}σ^2\hat{\sigma}^{2}

s2=1n1i=1n(XiXˉ)2s^{2} = \frac{1}{n-1} \sum_{i=1}^{n} (X_{i} - \bar{X})^{2}

我们来检验其无偏性:

E[s2]=E[1n1i=1n(XiXˉ)2]=1n1E[i=1n(XiXˉ)2]E[s^{2}] = E\left[ \frac{1}{n-1} \sum_{i=1}^{n} (X_{i} - \bar{X})^{2} \right] = \frac{1}{n-1} E\left[ \sum_{i=1}^{n} (X_{i} - \bar{X})^{2} \right]

利用 E[(XiXˉ)2]=(n1)σ2E\left[\sum (X_{i} - \bar{X})^{2}\right] = (n-1)\sigma^{2} 这一结论,我们得到:

E[s2]=1n1(n1)σ2=σ2E[s^{2}] = \frac{1}{n-1} (n-1)\sigma^{2} = \sigma^{2}

因此,s2s^{2} 是总体方差 σ2\sigma^{2} 的一个无偏估计量。分母中的 n1n-1 被称为自由度 (Degrees of Freedom),是对因使用样本均值替代总体均值而损失掉一个信息自由度的补偿。

在计量经济学中的应用

线性回归模型中,无偏性是评价普通最小二乘法 (Ordinary Least Squares, OLS) 估计量好坏的基石。考虑一个简单的线性回归模型:

Yi=β0+β1Xi+uiY_{i} = \beta_{0} + \beta_{1} X_{i} + u_{i}

其中,β0\beta_{0}β1\beta_{1} 是未知的真实参数,uiu_{i}误差项。OLS 方法给出了 β0\beta_{0}β1\beta_{1} 的估计量 β^0\hat{\beta}_{0}β^1\hat{\beta}_{1}

为了使 OLS 估计量是无偏的,即 E[β^1]=β1E[\hat{\beta}_{1}] = \beta_{1}E[β^0]=β0E[\hat{\beta}_{0}] = \beta_{0},必须满足一系列假设,这些假设统称为高斯-马尔可夫定理 (Gauss-Markov Theorem) 的假设。其中,对无偏性最关键的假设是 零条件均值假设 (Zero Conditional Mean Assumption):

E[uiXi]=0E[u_{i} | X_{i}] = 0

该假设意味着,在给定任何解释变量 XiX_{i} 的值的情况下,误差项 uiu_{i} 的平均值为零。换言之,所有影响 YiY_{i} 但未被 XiX_{i} 包含的因素(它们被归入 uiu_{i})与 XiX_{i} 不存在系统性关联。

如果这个假设不成立(例如,存在遗漏变量偏误测量误差同时性偏误),OLS 估计量就会变成有偏估计量,从而导致错误的统计推断。

无偏性的重要性与局限

重要性: 无偏性是评价估计量的一个非常直观且重要的"起点"。它确保了我们的估计方法没有系统性的错误方向,在多次应用中,估计结果能够围绕真实值波动。在许多理论推导和证明中,无偏性是一个基础性的良好性质。

局限性:

  • 无偏不等于精确: 一个无偏估计量在其单次估计中可能离真实值很远。无偏性只保证"平均正确",但没有对估计量的方差 (Variance) 做出任何限制。一个方差极大的无偏估计量可能在实际应用中毫无价值。
  • 偏误-方差权衡 (Bias-Variance Tradeoff): 在某些情况下,一个有轻微偏误但方差很小的估计量,可能比一个无偏但方差很大的估计量更受欢迎。这是因为前者的估计值"通常"离真实值更近。评价估计量的综合标准是均方误差 (Mean Squared Error, MSE),其定义为: \[ \text{MSE}(\hat{\theta}) = E[(\hat{\theta} - \theta)^{2}] = \text{Var}(\hat{\theta}) + [\text{Bias}(\hat{\theta})]^{2} \] 在某些高级计量经济学方法(如岭回归)中,研究者会有意引入少量偏误来换取方差的大幅下降,以期获得更低的均方误差。
  • 大样本性质: 无偏性是一个在任何样本容量下都可能成立的性质(称为"小样本性质")。然而,对于大样本而言,一致性 (Consistency) 是一个更重要的性质。一致性指当样本容量 nn \to \infty 时,估计量会依概率收敛于真实参数值。有些估计量在小样本中是有偏的,但却是渐近无偏的(如前文提到的 Sn2S_{n}^{2}),这类估计量在实践中仍然非常有用。