ARTICLE

方差齐性

方差齐性 (Homoscedasticity) 方差齐性 (Homoscedasticity)，源于希腊语 "homo" (相同) 和 "skedasis" (离散)，是统计学，特别是回归分析中的一个核心假设。它指的是在一个统计模型中，随机误差项（或称残差）的方差在所有观测值上都保持不变。换言之，无论自变量的取值如何变化，因变量的观测值围绕其期望值的离散程度

浏览 44 更新 2025-10-26

方差齐性 (Homoscedasticity)

方差齐性 (Homoscedasticity)，源于希腊语 "homo" (相同) 和 "skedasis" (离散)，是统计学，特别是回归分析中的一个核心假设。它指的是在一个统计模型中，随机误差项（或称残差）的方差在所有观测值上都保持不变。换言之，无论自变量的取值如何变化，因变量的观测值围绕其期望值的离散程度都是恒定的。

与方差齐性相对的概念是异方差性 (Heteroscedasticity)，即误差项的方差随自变量的取值而变化。理解方差齐性对于正确应用和解释回归模型至关重要，特别是经典的线性回归模型。

方差齐性在回归模型中的数学表达

在标准的线性回归模型中，我们假设因变量 $Y$ 和自变量 $X$ 之间的关系可以表示为：

Y_i = \beta_0 + \beta_1 X_{1i} + \beta_2 X_{2i} + \ldots + \beta_k X_{ki} + \epsilon_i

其中， $i$ 表示第 $i$ 个观测样本， $Y_i$ 是因变量的观测值， $X_{ji}$ 是第 $j$ 个自变量的第 $i$ 个观测值， $\beta_j$ 是待估计的回归系数，而 $\epsilon_i$ 是不可观测的误差项。

方差齐性假设关注的是误差项 $\epsilon_i$ 的方差。其数学表达为：

\operatorname{Var}(\epsilon_i) = \mathbb{E}(\epsilon_i^2) = \sigma^2 \quad \text{for all } i = 1, 2, \ldots, n

这里的 $\mathbb{E}(\cdot)$ 代表期望值， $\operatorname{Var}(\cdot)$ 代表方差。这个公式意味着，对于每一个观测样本 $i$ ，其误差项的方差都是一个常数 $\sigma^2$ 。它不依赖于任何自变量 $X_j$ 的值，也不依赖于观测样本的序号 $i$ 。

相比之下，异方差性的情况则表示为：

\operatorname{Var}(\epsilon_i) = \sigma_i^2

这意味着误差项的方差 $\sigma_i^2$ 随着观测样本 $i$ 的不同而变化，通常是自变量 $X$ 的某个函数。

方差齐性的重要性：为什么这是一个关键假设？

方差齐性是高斯-马尔可夫定理 (Gauss-Markov Theorem) 的核心假设之一。该定理证明，在一系列假设（包括方差齐性）下，通过普通最小二乘法 (Ordinary Least Squares, OLS) 得到的回归系数估计量是最佳线性无偏估计量 (Best Linear Unbiased Estimator, BLUE)。当方差齐性假设不成立（即存在异方差性）时，会产生以下严重后果：

对OLS估计量的影响

无偏性 (Unbiasedness) 依然成立：即使存在异方差性，OLS估计出的回归系数（ $\hat{\beta}_j$ ）仍然是无偏的。这意味着，在大量重复抽样中，估计系数的平均值仍然会等于真实的总体系数 $\beta_j$ 。
一致性 (Consistency) 依然成立：随着样本量的增加，OLS估计量仍然会收敛于真实的总体参数。
不再具有最小方差性 (Not BLUE)：在异方差性存在的情况下，OLS估计量不再是"最佳"的，即它不再是所有线性无偏估计量中方差最小的。存在其他方法（如加权最小二乘法）可以得到方差更小的无偏估计量。这意味着OLS估计量的效率降低了。

对统计推断的影响

这是异方差性带来的最严重的问题。标准的OLS回归程序计算出的标准误 (Standard Errors)、t统计量和F统计量都是基于方差齐性假设的。

标准误的偏误：当存在异方差性时，OLS的标准误计算公式是错误的，从而导致对估计系数方差的估计是有偏的。这通常会导致标准误被低估。
错误的假设检验：由于标准误是计算t统计量（ $t = \frac{\hat{\beta}_j - \beta_{j,0}}{\operatorname{SE}(\hat{\beta}_j)}$ ）的分母，一个被低估的标准误会使得t统计量被人为地夸大。这会导致我们更倾向于拒绝"系数不显著"的原假设，从而得出某个自变量显著的错误结论（即增加了犯第一类错误的概率）。
无效的置信区间：同样，计算出的置信区间会比真实的置信区间更窄，使得我们对参数估计的精度过于自信。

总之，异方差性不会破坏OLS估计量的无偏性，但它会彻底破坏基于OLS的假设检验和置信区间的可靠性，使得模型的统计推断完全失效。

如何检验方差齐性

在进行回归分析后，必须对模型是否存在异方差性进行检验。常用的方法分为图形分析和统计检验。

一、图形分析法 (残差图)

这是一种直观且常用的方法。主要通过绘制残差图（通常是残差 $\hat{\epsilon}_i$ 或其平方 $\hat{\epsilon}_i^2$ 对预测值 $\hat{Y}_i$ 或某个自变量 $X_j$ 的散点图）来判断。

方差齐性：如果散点图中的点随机分布在一个水平带内，没有显示出任何系统性的模式，则表明方差齐性假设可能成立。
异方差性：如果散点图显示出明显的模式，例如： \begin{itemize}
喇叭形/扇形：点的散布范围随着 $\hat{Y}_i$ 或 $X_j$ 的增加而扩大或缩小。这是最典型的异方差性模式。
曲线形：点的散布呈现出U形或倒U形。

\end{itemize}

图形法简单直观，但其结论具有一定的主观性。

二、统计检验法

为了得到更客观的结论，可以使用正式的统计检验方法。

Breusch-Pagan检验 (BP检验)：该检验通过一个辅助回归来完成。它将OLS回归得到的残差平方 $\hat{\epsilon}_i^2$ 对原始模型中的所有自变量进行回归。如果这些自变量能够在很大程度上解释残差平方的变异，则表明存在异方差性。其原假设为"不存在异方差性"（即方差齐性成立）。
White检验：这是BP检验的一个更一般化的版本。它不仅在辅助回归中包含原始的自变量，还包括了自变量的平方项和交叉相乘项。这使得White检验能够检测更复杂形式的异方差性，并且不需要知道异方差性的具体形式。其缺点是在自变量较多时会消耗大量的自由度。

异方差性的处理方法

如果检验发现模型存在显著的异方差性，研究者必须采取措施进行修正。

一、使用稳健标准误

这是现代计量经济学中最常用、最直接的方法。它并不改变OLS估计的系数本身，而是修正其标准误的计算公式，使其在异方差性存在的情况下依然是一致的。这种修正后的标准误被称为异方差性-稳健标准误 (Heteroscedasticity-Robust Standard Errors)，或White标准误。几乎所有的现代统计软件（如Stata, R, Python）都提供了计算稳健标准误的选项。这使得即使在存在异方差性的情况下，我们仍然可以进行有效的假设检验和构建有效的置信区间。

二、加权最小二乘法 (WLS)

如果异方差性的形式是已知的（即我们知道 $\sigma_i^2$ 与哪些变量相关以及如何相关），那么可以使用加权最小二乘法 (Weighted Least Squares, WLS)。WLS是广义最小二乘法 (Generalized Least Squares, GLS) 的一个特例。其基本思想是为不同方差的观测值赋予不同的权重。具体来说，方差较大的观测值（信息量较少）被赋予较小的权重，而方差较小的观测值（信息量较多）被赋予较大的权重。通过这种加权，WLS可以得到比OLS更有效率的估计量。在实践中，真实的误差方差通常未知，需要通过一个模型来估计，这种方法被称为可行广义最小二乘法（Feasible Generalized Least Squares, FGLS）。

三、变量变换

有时，对模型中的变量（特别是因变量）进行适当的数学变换，如取对数(log)、取平方根等，可以有效缓解或消除异方差性问题。例如，在处理与规模（如公司市值、收入）相关的经济数据时，取对数是一种非常常见的做法，因为它不仅可以压缩数据的尺度，还常常能使数据的方差变得更加稳定。

总结

方差齐性是保证OLS估计量具有优良统计特性（特别是有效性）和确保统计推断可靠性的基石。尽管违反此假设不影响参数估计的无偏性，但它会使标准的假设检验完全失效。因此，在任何回归分析中，都应将异方差性的诊断和处理作为标准流程的一部分。通过使用图形法和正式检验来识别问题，并采用稳健标准误或WLS等方法进行修正，是确保研究结论稳健可靠的关键步骤。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。