OLS 正规方程 (OLS Normal Equations)
OLS 正规方程是普通最小二乘估计中,通过对残差平方和求一阶条件所得到的一组线性方程组。求解该方程组即可得到回归系数的 OLS 估计量 β^=(X′X)−1X′y。正规方程是OLS估计的计算核心,也是理解线性回归代数结构的关键入口。
推导过程
考虑线性回归模型 y=Xβ+ε,其中 y 为 n×1 的因变量向量,X 为 n×k 的设计矩阵,β 为 k×1 的未知参数向量。OLS 的目标是最小化残差平方和 (SSR):
S(β)=ε′ε=(y−Xβ)′(y−Xβ)
将 SSR 展开:
S(β)=y′y−2y′Xβ+β′X′Xβ
对 β 求梯度并令其为零。利用矩阵求导法则 ∂β∂(a′β)=a 以及 ∂β∂(β′Aβ)=2Aβ(当 A 对称时):
∂β∂S=−2X′y+2X′Xβ=0
整理即得 正规方程:
X′Xβ^=X′y
这套由 k 个方程构成的线性方程组等价于将每个解释变量与残差正交化:第 j 个方程为 xj′(y−Xβ^)=0,即第 j 个解释变量与 OLS 残差向量的内积为零。这是 OLS 残差与所有解释变量正交的代数体现。
矩阵形式与求解
正规方程的矩阵形式清晰展现了其分块结构:
x1′x1x2′x1⋮xk′x1x1′x2x2′x2⋮xk′x2⋯⋯⋱⋯x1′xkx2′xk⋮xk′xkβ^1β^2⋮β^k
=
\begin{bmatrix}
\(\mathbf{x}_1\)'\(\mathbf{y}\) \\ \(\mathbf{x}_2\)'\(\mathbf{y}\) \\ \vdots \\ \(\mathbf{x}_k\)'\(\mathbf{y}\)
\[
\end{bmatrix}
\]
当 X′X 可逆(即设计矩阵列满秩,不存在严格多重共线性)时,OLS 估计量有唯一解:
β^=(X′X)−1X′y
对于简单线性回归 yi=β0+β1xi+εi,正规方程退化为两个标量方程:
nβ^0+β^1∑xiβ^0∑xi+β^1∑xi2=∑yi=∑xiyi
由此解出熟知的公式 β^1=∑(xi−xˉ)2∑(xi−xˉ)(yi−yˉ),β^0=yˉ−β^1xˉ。
几何直觉
正规方程 X′Xβ^=X′y 可改写为 X′(y−Xβ^)=0,即 X′ε^=0。这意味着残差向量 ε^ 与设计矩阵 X 的所有列向量正交。从几何角度看,OLS 拟合值 y^=Xβ^ 是 y 在 X 的列空间上的正交投影——正规方程正是投影算子 P=X(X′X)−1X′ 的构造基础。
性质与应用
正规方程直接导出 OLS 的若干核心性质:
- 一阶条件保证:正规方程是 SSR 最小化的必要条件。当 X′X 正定时,二阶条件自动满足,所得解为全局最小值。
- 线性性:β^=(X′X)−1X′y 是 y 的线性函数,这是Gauss-Markov 定理成立的前提之一。
- 无偏性条件:若 E(ε∣X)=0,代入正规方程可得 E(β^∣X)=β。
- 数值计算:实践中通常不直接求逆,而是通过 QR 分解或 Cholesky 分解求解正规方程,以提高数值稳定性。
当误差项存在异方差或自相关时,正规方程可推广为广义最小二乘 (GLS) 的形式:X′Ω−1Xβ^=X′Ω−1y,其中 Ω 为误差协方差矩阵。这一推广保持了正规方程"加权正交"的核心思想。