ARTICLE
残差图
残差图(Residual Plot)是回归诊断中用于检验模型假设的核心图形工具。它以残差(观测值与拟合值之差)为纵轴,以拟合值、自变量或观测顺序为横轴绘制散点图,从而可视化地揭示模型可能存在的设定偏误、异方差、非线性及异常值等问题。在实证经济学研究中,残差图是 OLS 回归后不可或缺的诊断步骤——任何不经残差检验就接受的回归结果,其推断的有效性都悬而未决。
残差图(Residual Plot)是回归诊断中用于检验模型假设的核心图形工具。它以残差(观测值与拟合值之差)为纵轴,以拟合值、自变量或观测顺序为横轴绘制散点图,从而可视化地揭示模型可能存在的设定偏误、异方差、非线性及异常值等问题。在实证经济学研究中,残差图是 OLS 回归后不可或缺的诊断步骤——任何不经残差检验就接受的回归结果,其推断的有效性都悬而未决。
基本形式与构造
最常用的残差图将标准化残差 (或学生化残差)对拟合值 绘制。若模型假设成立,残差应满足零均值、等方差且无系统模式,图像表现为围绕零线随机散布的水平带状。此外,常见的变体包括:
- 残差-自变量图:检测遗漏的非线性关系或交互效应。
- Q-Q 图(分位数-分位数图):将标准化残差的分位数对正态分布理论分位数绘制,用以判断正态性假设。
- Scale-Location 图:将 对拟合值绘制,放大异方差模式的视觉信号。
- 残差-Leverage 图(Residuals vs Leverage):叠加 Cook 距离等高线,识别对回归系数有不成比例影响的高杠杆点。
模式诊断
残差图中特定形态对应特定的模型问题:
- 漏斗形(喇叭形):残差散布随拟合值增大而扩大(或缩小),指示异方差。此时应检验 Breusch-Pagan 或 White 检验,并考虑使用稳健标准误(Huber-White)或 WLS。
- 弯曲/∪ 形:残差呈现系统性曲线,表明遗漏了平方项或交互项——模型线性假设被违反。解决方案是加入 、 或采用非参数回归。
- 倾斜带状:出现在因变量为二值或计数数据时,提示 OLS 不适用,应改用 logit、probit 或 Poisson 模型。
- 孤立离群点:某观测的标准化残差绝对值显著大于 3(或学生化残差大于 ±2),标记为潜在异常值,需逐一核查数据来源或测量误差。
- 序列相关模式:残差呈现长游程(连续正值后连续负值),对时间序列数据意味着自相关——应检查 Durbin-Watson 统计量并使用 Newey-West 标准误或 AR 类模型。
经济学应用与汇报
在经济学实证中,残差图常用于:劳动经济学中诊断 Mincer 工资方程的设定偏误(如遗漏教育平方项导致的非线性残差);金融计量中检测 CAPM 回归的异方差与厚尾特征;发展经济学中鉴别政策评估回归中的异常观测(如极端值驱动的显著性)。汇报回归结果时,建议在附录或稳健性检验部分提供关键残差图,以增强结论的可信度与可复现性。
残差图的最佳实践可总结为:每次 OLS 回归后务必检视残差-拟合值图与 Q-Q 图;遇到非随机模式时,针对性修正模型而非无视诊断信号——选择性地只报告"好看"的残差图本身就是一种 p-hacking 的变体;对高维数据可结合偏残差图(partial residual plot / component-plus-residual plot)分解各变量的边际效应。残差图的终极价值不在于发现"完美"的随机散布,而在于通过识别偏离来引导模型改进,使统计推断建立在更可靠的基础之上。多数权威计量教科书(如 Wooldridge 和 Angrist \& Pischke)均强调:"诊断优于估计"——模型设定正确性的检验至少应与参数估计本身受到同等重视。