ARTICLE

幂等矩阵

幂等矩阵 (Idempotent Matrix) 幂等矩阵是线性代数中满足 A^2 = A 的方阵 A,即矩阵与其自身的乘积等于自身。名称源于"幂等"(idempotent),指重复作用不改变结果——投影一次与投影两次效果相同。幂等矩阵在计量经济学、统计学和线性回归中扮演核心角色。 定义与基本性质 设 A R^n n,若 A^2 = A,则 A 为幂等矩阵。

浏览 0 更新 2025-10-28

幂等矩阵 (Idempotent Matrix)

幂等矩阵是线性代数中满足 A2=AA^2 = A 的方阵 AA,即矩阵与其自身的乘积等于自身。名称源于"幂等"(idempotent),指重复作用不改变结果——投影一次与投影两次效果相同。幂等矩阵在计量经济学统计学线性回归中扮演核心角色。

定义与基本性质

ARn×nA \in \mathbb{R}^{n \times n},若 A2=AA^2 = A,则 AA 为幂等矩阵。由定义直接可推导:

Ak=A,kN+A^k = A, \quad \forall k \in \mathbb{N}^+

所有正整数次幂均等于自身。若 AA 可逆且幂等,则 A=IA = I(单位阵),因为 A=A1A2=A1A=IA = A^{-1}A^2 = A^{-1}A = I。因此,非平凡的幂等矩阵必然是奇异矩阵

特征值与秩

幂等矩阵的特征值只能是 0 或 1。设 λ\lambdaAA 的特征值,v\mathbf{v} 为对应特征向量:

Av=λv    A2v=λ2v=Av=λvA\mathbf{v} = \lambda\mathbf{v} \implies A^2\mathbf{v} = \lambda^2\mathbf{v} = A\mathbf{v} = \lambda\mathbf{v}

因此 λ2=λ\lambda^2 = \lambda,即 λ{0,1}\lambda \in \{0, 1\}

一个重要结论是:幂等矩阵的等于其

tr(A)=rank(A)\operatorname{tr}(A) = \operatorname{rank}(A)

这是因为迹是特征值之和(每个非零特征值为 1),而秩等于非零特征值的个数。

几何意义:投影矩阵

幂等矩阵的几何本质是投影算子。将 Rn\mathbb{R}^n 分解为 列空间 C(A)C(A)零空间 N(A)N(A)

  • 对任意 yC(A)\mathbf{y} \in C(A),存在 x\mathbf{x} 使 y=Ax\mathbf{y} = A\mathbf{x},于是 Ay=A2x=Ax=yA\mathbf{y} = A^2\mathbf{x} = A\mathbf{x} = \mathbf{y}——列空间上的向量被固定。
  • 对任意 zN(A)\mathbf{z} \in N(A)Az=0A\mathbf{z} = \mathbf{0}——零空间上的向量被消灭。

AA 对称时,投影是正交投影;非对称幂等矩阵对应斜投影。

计量经济学中的核心应用

线性回归模型 y=Xβ+ε\mathbf{y} = X\boldsymbol{\beta} + \boldsymbol{\varepsilon} 中,两个关键幂等矩阵是:

1. 投影矩阵(帽子矩阵)

P=X(XTX)1XTP = X(X^TX)^{-1}X^T

它将 y\mathbf{y} 投影到 XX 的列空间上:y^=Py\hat{\mathbf{y}} = P\mathbf{y}。易验证 P2=PP^2 = PPT=PP^T = P,是对称幂等矩阵。其迹 tr(P)=k\operatorname{tr}(P) = k(自变量个数)。

2. 残差生成矩阵

M=IP=IX(XTX)1XTM = I - P = I - X(X^TX)^{-1}X^T

它将 y\mathbf{y} 映射为残差:ε^=My\hat{\boldsymbol{\varepsilon}} = M\mathbf{y}。同样满足 M2=MM^2 = MMT=MM^T = Mtr(M)=nk\operatorname{tr}(M) = n - k(自由度)。

PPMM 正交:PM=P(IP)=PP2=0PM = P(I-P) = P - P^2 = 0,体现拟合值与残差的不相关性。

方差分析中的应用

方差分析(ANOVA)中,总平方和可分解为回归平方和与残差平方和:

yTy=yTPy+yTMy\mathbf{y}^T\mathbf{y} = \mathbf{y}^T P \mathbf{y} + \mathbf{y}^T M \mathbf{y}

利用幂等性,可证明二次型 yTPy/σ2\mathbf{y}^T P \mathbf{y}/\sigma^2 服从非中心卡方分布,这是 F 检验和 t 检验的分布理论基础。Cochran定理给出了相互独立的幂等二次型分解的条件。

其他性质

  • AA 幂等,则 IAI - A 也幂等:(IA)2=I2A+A2=IA(I-A)^2 = I - 2A + A^2 = I - A
  • 幂等矩阵的特征值分解:对称幂等矩阵可写为 A=QΛQTA = Q\Lambda Q^T,其中 Λ=diag(1,,1,0,,0)\Lambda = \operatorname{diag}(1,\ldots,1,0,\ldots,0)
  • AA 幂等当且仅当 rank(A)+rank(IA)=n\operatorname{rank}(A) + \operatorname{rank}(I - A) = n

幂等矩阵将抽象的投影概念代数化,是连接线性代数与统计推断的桥梁。理解其性质对掌握最小二乘估计的几何含义以及假设检验的分布理论至关重要。