ARTICLE

零化矩阵

零化矩阵 零化矩阵在计量经济学与线性代数中有双重所指:广义上指幂零矩阵(nilpotent matrix),即存在正整数 k 使得 N^k = 0 的方阵;狭义上特指OLS回归中的残差生成矩阵(residual maker)M = I - X(X'X)^-1X',因其将 X 零化(MX = 0)而得名。两者均体现了"将某对象映射为零"的代数结构。 幂零矩阵

浏览 0 更新 2025-10-26

零化矩阵

零化矩阵在计量经济学与线性代数中有双重所指:广义上指幂零矩阵(nilpotent matrix),即存在正整数 kk 使得 Nk=0N^k = 0 的方阵;狭义上特指OLS回归中的残差生成矩阵(residual maker)M=IX(XX)1XM = I - X(X'X)^{-1}X',因其将 XX 零化(MX=0MX = 0)而得名。两者均体现了"将某对象映射为零"的代数结构。

幂零矩阵

方阵 NRn×nN \in \mathbb{R}^{n \times n} 称为幂零矩阵,若存在最小正整数 kk(幂零指数,index of nilpotency)使得 Nk=0N^k = 0Nk10N^{k-1} \neq 0。核心性质:幂零矩阵的所有特征值均为零——若 λ\lambdaNN 的特征值,则由 Nkv=λkv=0N^k v = \lambda^k v = 0 推得 λ=0\lambda = 0。由此,tr(N)=0\operatorname{tr}(N) = 0det(N)=0\det(N) = 0,且特征多项式为 p(λ)=λnp(\lambda) = \lambda^nCayley-Hamilton定理直接给出 Nn=0N^n = 0,故幂零指数上限为 nn)。

Jordan标准型视角:幂零矩阵相似于由Jordan块 Jm(0)J_m(0)(对角线为零、超对角线为 1 的 m×mm \times m 矩阵)构成的块对角矩阵,其中最大 Jordan 块尺寸等于幂零指数。典型例子:N=(010001000)N = \begin{pmatrix} 0 & 1 & 0 \\ 0 & 0 & 1 \\ 0 & 0 & 0 \end{pmatrix} 满足 N20N^2 \neq 0N3=0N^3 = 0,幂零指数为 3。

OLS 残差生成矩阵(零化子矩阵)

线性回归模型 Y=Xβ+εY = X\beta + \varepsilon 中,定义投影矩阵 P=X(XX)1XP = X(X'X)^{-1}X'残差生成矩阵 M=IPM = I - PMM幂等矩阵M2=MM^2 = M)且满足关键零化性质:MX=0MX = 0——解释变量矩阵被 MM 零化。对因变量 YYMY=YXβ^=ε^MY = Y - X\hat{\beta} = \hat{\varepsilon} 即 OLS 残差向量。

MM 的代数与统计性质:

  • rank(M)=nk\operatorname{rank}(M) = n - k,其中 kk 为回归元个数,对应残差自由度。
  • 幂等性M2=MM^2 = M,保证投影的不可压缩性。
  • 正交性MP=PM=0MP = PM = 0,残差空间与拟合值空间正交。
  • tr(M)=nk\operatorname{tr}(M) = n - k,残差方差无偏估计 σ^2=YMYnk\hat{\sigma}^2 = \frac{Y'MY}{n-k} 直接依赖于此。

核心应用

Frisch-Waugh-Lovell定理(FWL):将回归元分块 X=[X1,X2]X = [X_1, X_2],定义 M1=IX1(X1X1)1X1M_1 = I - X_1(X_1'X_1)^{-1}X_1' 零化 X1X_1,则 X2X_2 在排除 X1X_1 影响后的偏回归系数 β^2\hat{\beta}_2 等价于 M1YM_1 YM1X2M_1 X_2 的回归系数。FWL 定理将多元回归分解为逐次"零化—回归"的清洗过程,是理解固定效应去均值化工具变量两阶段最小二乘法的代数基础。

残差诊断MM 的对角元素 hiih_{ii}杠杆值)度量第 ii 个观测对拟合值的拉动强度;标准化残差和Cook距离均依赖 MM 的结构。若 MM 接近零矩阵则模型近乎完美拟合(过拟合风险),若 MIM \approx IXX 几乎无解释力。

差分算子为零化矩阵特例:一阶差分矩阵 Δ\Delta 作用于时间序列时,零化常数项——因 Δc=0\Delta c = 0。面板数据的组内变换(within transformation)矩阵 Q=ID(DD)1DQ = I - D(D'D)^{-1}D'DD 为个体虚拟变量矩阵)零化个体均值,是 MM 结构在面板数据固定效应估计中的直接推广。

与幂零矩阵的区别

注意:OLS 的 MM 是幂等(idempotent)而非幂零——M2=M0M^2 = M \neq 0(除非 M=0M = 0)。幂零矩阵描述"经有限步到达零"的动态过程,在差分方程协整向量误差修正模型(VECM)和状态空间模型的能达性分析中有重要应用。两种零化结构——幂零的逐步消去与幂等的瞬时投影——共同构成计量经济学中线性代数工具的两条核心脉络。