均值预测 (Mean Prediction)
均值预测 (Mean Prediction) 是 回归分析 和 时间序列分析 中的核心概念,指在给定一组自变量 x0 的条件下对因变量 Y 的 条件期望 E(Y∣x0) 进行的点估计。与对单个新观测值的预测不同,均值预测关注的是在特定条件下所有可能观测值的平均结果。在线性回归框架中,均值预测是最优线性无偏预测(BLUP)的直接应用,同时也是构造预测区间的基础。
回归模型中的均值预测
设经典线性回归模型为 Y=Xβ+ε,其中 E(ε∣X)=0。对于新给定的自变量向量 x0(1×k 行向量),均值预测的目标是估计 E(Y0∣x0)=x0β。利用 OLS 估计量 β^=(X′X)−1X′Y,均值预测的点估计为:
Y^0=x0β^
该预测具有两个重要的最优性质。首先是无偏性:E(Y^0)=x0E(β^)=x0β=E(Y0∣x0),即 OLS 预测提供了条件均值的无偏估计。其次是最小方差:在所有 Y 的线性无偏预测中,Y^0 的方差最小,这是 高斯-马尔可夫定理 的直接推论。
均值预测的方差与区间
均值预测的方差不同于个体预测的方差,这一区别在统计推断中至关重要。均值预测估计量 Y^0 的方差来源于估计 β^ 本身的抽样变异,计算公式为:
Var(Y^0)=σ2⋅x0(X′X)−1x0′
其中 σ2 为 误差项 的方差,通常用 σ^2=n−k1∑i=1nε^i2 估计。由此可得均值预测的 置信区间:
Y^0±tα/2,n−k⋅σ^x0(X′X)−1x0′
个体预测的方差则需额外考虑随机误差本身的波动,即 Var(Y^0+ε0)=σ2[1+x0(X′X)−1x0′],因此个体预测区间总是宽于均值预测区间。当自变量取均值点(x0=xˉ)时,均值预测方差达到最小 σ2/n;当 x0 远离样本中心时,区间迅速变宽,呈双曲线形。
应用与局限
均值预测在 计量经济学 中有广泛应用。在 政策评估 中,研究者关心的是政策变量取特定值时结果变量的平均效应,而非某个体的具体结果,这正是均值预测的价值所在。在 时间序列 中,ARMA 模型的多步超前预测本质上也是均值预测,预测值收敛于过程的无条件均值。在 机器学习 的回归任务中,任何最小化均方误差(MSE)的模型输出都等价于对条件期望的估计。
均值预测的主要局限在于其依赖于模型设定的正确性。若回归函数被错误指定(如遗漏非线性项),条件均值的预测将产生系统性偏差。此外,当 x0 超出训练数据的范围进行外推时,均值预测的风险急剧增大,因为 x0(X′X)−1x0′ 可能变得非常大。实践中应始终报告均值预测的标准误和置信区间,以清晰传达预测的不确定性。