ARTICLE

对称幂等矩阵

对称幂等矩阵 (Symmetric Idempotent Matrix) 对称幂等矩阵 (Symmetric Idempotent Matrix) 是一类同时满足对称性 (Symmetry) 与幂等性 (Idempotence) 的重要矩阵。具体而言,若矩阵 A R^n n 满足 A^ = A(对称)且 A^2 = A(幂等),则称 A 为对称幂等矩阵。这类

浏览 0 更新 2025-12-12

对称幂等矩阵 (Symmetric Idempotent Matrix)

对称幂等矩阵 (Symmetric Idempotent Matrix) 是一类同时满足对称性 (Symmetry) 与幂等性 (Idempotence) 的重要矩阵。具体而言,若矩阵 ARn×nA \in \mathbb{R}^{n \times n} 满足 A=AA^{\top} = A(对称)且 A2=AA^{2} = A(幂等),则称 AA 为对称幂等矩阵。这类矩阵在数理统计、计量经济学、线性代数及优化理论中具有核心地位,其最本质的直观解释是:对称幂等矩阵即为正交投影矩阵——它将任意向量投影到某个子空间上。

定义与基本性质

ARn×nA \in \mathbb{R}^{n \times n} 为对称幂等矩阵,则以下性质恒成立:

  • 投影性:对任意向量 xRn\mathbf{x} \in \mathbb{R}^{n}AxA\mathbf{x}x\mathbf{x}Col(A)\text{Col}(A)AA 的列空间)上的正交投影。
  • 特征值仅为 0 或 1:由 A2=AA^{2}=A 可知 AA 的特征多项式仅含根 0 和 1;由 A=AA^{\top}=A 可知 AA 可正交对角化,因此存在正交矩阵 QQ 使得 A=QΛQA = Q\Lambda Q^{\top},其中 Λ=diag(1,,1,0,,0)\Lambda = \text{diag}(1,\ldots,1,0,\ldots,0)
  • 秩等于迹rank(A)=tr(A)\text{rank}(A) = \text{tr}(A)。因为迹等于特征值之和,而特征值非 0 即 1,故非零特征值的个数(即秩)恰好等于迹。
  • 幂等补InAI_{n} - A 也是对称幂等矩阵,它投影到 Col(A)\text{Col}(A) 的正交补空间 Col(A)\text{Col}(A)^{\perp} 上,且 rank(InA)=nrank(A)\text{rank}(I_{n} - A) = n - \text{rank}(A)
  • 半正定性:对任意 xRn\mathbf{x} \in \mathbb{R}^{n}xAx=xA2x=xAAx=Ax20\mathbf{x}^{\top}A\mathbf{x} = \mathbf{x}^{\top}A^{2}\mathbf{x} = \mathbf{x}^{\top}A^{\top}A\mathbf{x} = \|A\mathbf{x}\|^{2} \ge 0,因此 AA半正定矩阵 (Positive Semidefinite Matrix)。

谱分解与几何含义

对称幂等矩阵的谱分解揭示了其最深刻的几何内涵。由谱定理,存在正交矩阵 QQ 使得:

A=Q(Ir000)Q,A = Q\begin{pmatrix} I_{r} & 0 \\ 0 & 0 \end{pmatrix} Q^{\top},

其中 r=rank(A)r = \text{rank}(A)。若记 Q=[Q1  Q2]Q = [Q_{1} \; Q_{2}]Q1Rn×rQ_{1} \in \mathbb{R}^{n \times r},则 A=Q1Q1A = Q_{1}Q_{1}^{\top},而 Q1Q_{1} 的列张成了 Col(A)\text{Col}(A) 的一组标准正交基。因此,Ax=Q1Q1xA\mathbf{x} = Q_{1}Q_{1}^{\top}\mathbf{x} 正是将 x\mathbf{x}Col(A)\text{Col}(A) 作正交投影的表达式。

这一定理表明:任何一个对称幂等矩阵都唯一地对应于一个投影子空间(即其列空间),且该投影是正交的。反过来,给定任意一个子空间 VRnV \subseteq \mathbb{R}^{n},存在唯一一个对称幂等矩阵 PVP_{V} 使得 Col(PV)=V\text{Col}(P_{V}) = V,该矩阵即为向 VV 的正交投影矩阵。

在统计学中的核心地位

对称幂等矩阵在数理统计与计量经济学中扮演着不可替代的角色,主要体现在以下三方面。

二次型的分布

yN(0,σ2In)\mathbf{y} \sim N(\mathbf{0}, \sigma^{2}I_{n}) 为标准正态向量,AA 为对称幂等矩阵。则二次型 yAy/σ2χrank(A)2\mathbf{y}^{\top}A\mathbf{y} / \sigma^{2} \sim \chi^{2}_{\text{rank}(A)},即服从自由度为 rank(A)\text{rank}(A)卡方分布。这一定理是方差分析 (ANOVA) 和回归诊断的数学基础。

Cochran 定理

Cochran 定理 (Cochran's Theorem) 是方差分析的基石。设 yN(μ,σ2In)\mathbf{y} \sim N(\boldsymbol{\mu}, \sigma^{2}I_{n}),且 A1,A2,,AkA_{1}, A_{2}, \ldots, A_{k} 为对称幂等矩阵,满足 i=1kAi=In\sum_{i=1}^{k} A_{i} = I_{n}。则以下三个条件等价:各 AiA_{i} 两两正交(即 AiAj=0A_{i}A_{j}=0iji \neq j)、各二次型 yAiy\mathbf{y}^{\top}A_{i}\mathbf{y} 相互独立、各 yAiy/σ2\mathbf{y}^{\top}A_{i}\mathbf{y}/\sigma^{2} 服从自由度为 rank(Ai)\text{rank}(A_{i}) 的卡方分布。这为分割总平方和并检验各效应的显著性提供了严格的数学依据。

最小二乘估计与投影

多元线性回归 y=Xβ+ε\mathbf{y} = X\boldsymbol{\beta} + \boldsymbol{\varepsilon} 中,普通最小二乘估计\hat{β\boldsymbol{\beta}}对应的拟合值 y^=X(XX)1Xy\hat{\mathbf{y}} = X(X^{\top}X)^{-1}X^{\top}\mathbf{y}。其中帽子矩阵 H=X(XX)1XH = X(X^{\top}X)^{-1}X^{\top} 是一个对称幂等矩阵,它代表将观测向量 y\mathbf{y} 投影到 XX 的列空间(即模型空间)上的正交投影。类似地,残差向量 ε^=yy^=(InH)y\hat{\boldsymbol{\varepsilon}} = \mathbf{y} - \hat{\mathbf{y}} = (I_{n} - H)\mathbf{y} 的投影矩阵 InHI_{n} - H 也是对称幂等矩阵,它投影到模型空间的正交补(即残差空间)上。残差平方和 ε^ε^=y(InH)y\hat{\boldsymbol{\varepsilon}}^{\top}\hat{\boldsymbol{\varepsilon}} = \mathbf{y}^{\top}(I_{n} - H)\mathbf{y} 正是使用对称幂等矩阵构造的二次型,其分布性质(在正态假设下服从卡方分布)支撑了整个回归推断体系。

矩阵运算中的封闭性

对称幂等矩阵在若干矩阵运算下保持封闭:

  • 正交补:若 AA 对称幂等,则 IAI - A 亦然。
  • 直和:若 AABB 对称幂等且 AB=0AB = 0(即投影到正交子空间),则 A+BA + B 也是对称幂等矩阵,且 rank(A+B)=rank(A)+rank(B)\text{rank}(A+B) = \text{rank}(A) + \text{rank}(B)
  • Kronecker 积:若 AABB 对称幂等,则 ABA \otimes B 亦对称幂等,其秩为 rank(A)rank(B)\text{rank}(A)\text{rank}(B)

此外,对称幂等矩阵的Frobenius 内积具有简洁表达:A,BF=tr(AB)=tr(AB)\langle A, B \rangle_{F} = \text{tr}(A^{\top}B) = \text{tr}(AB)。若 AABB 投影到正交子空间,则 tr(AB)=0\text{tr}(AB) = 0

与广义逆矩阵的关系

对称幂等矩阵与Moore-Penrose 广义逆 (Moore-Penrose Pseudoinverse) 密切相关。事实上,若 AA 为对称幂等矩阵,则 AA 自身就是其自身的广义逆:A=A+A = A^{+}。更一般地,对于任意实矩阵 XX,对称幂等矩阵 X(XX)1XX(X^{\top}X)^{-1}X^{\top}IX(XX)1XI - X(X^{\top}X)^{-1}X^{\top} 分别对应 XX 的列空间及其正交补上的投影。

简单示例

考虑矩阵:

A=13(211121112),A = \frac{1}{3}\begin{pmatrix} 2 & -1 & -1 \\ -1 & 2 & -1 \\ -1 & -1 & 2 \end{pmatrix},

易验 A=AA^{\top}=AA2=AA^{2}=A,故 AA 为对称幂等矩阵。其秩为 2,迹也为 2;特征值为 1,1,01,1,0。该矩阵将 R3\mathbb{R}^{3} 中的任意向量投影到平面 x1+x2+x3=0x_{1}+x_{2}+x_{3}=0 上。I3A=13(111111111)I_{3}-A = \frac{1}{3}\begin{pmatrix} 1 & 1 & 1 \\ 1 & 1 & 1 \\ 1 & 1 & 1 \end{pmatrix} 则投影到该平面的法向量方向 (1,1,1)(1,1,1)^{\top} 上。

总体而言,对称幂等矩阵以其简洁的定义和丰富的数学结构,成为连接线性代数、几何直观与统计推断的关键桥梁。从最小二乘投影到卡方分布理论,从方差分析到主成分分析,这类矩阵为现代数据分析提供了不可或缺的理论工具。