对称幂等矩阵 (Symmetric Idempotent Matrix)
对称幂等矩阵 (Symmetric Idempotent Matrix) 是一类同时满足对称性 (Symmetry) 与幂等性 (Idempotence) 的重要矩阵。具体而言,若矩阵 A∈Rn×n 满足 A⊤=A(对称)且 A2=A(幂等),则称 A 为对称幂等矩阵。这类矩阵在数理统计、计量经济学、线性代数及优化理论中具有核心地位,其最本质的直观解释是:对称幂等矩阵即为正交投影矩阵——它将任意向量投影到某个子空间上。
定义与基本性质
设 A∈Rn×n 为对称幂等矩阵,则以下性质恒成立:
- 投影性:对任意向量 x∈Rn,Ax 是 x 在 Col(A)(A 的列空间)上的正交投影。
- 特征值仅为 0 或 1:由 A2=A 可知 A 的特征多项式仅含根 0 和 1;由 A⊤=A 可知 A 可正交对角化,因此存在正交矩阵 Q 使得 A=QΛQ⊤,其中 Λ=diag(1,…,1,0,…,0)。
- 秩等于迹:rank(A)=tr(A)。因为迹等于特征值之和,而特征值非 0 即 1,故非零特征值的个数(即秩)恰好等于迹。
- 幂等补:In−A 也是对称幂等矩阵,它投影到 Col(A) 的正交补空间 Col(A)⊥ 上,且 rank(In−A)=n−rank(A)。
- 半正定性:对任意 x∈Rn,x⊤Ax=x⊤A2x=x⊤A⊤Ax=∥Ax∥2≥0,因此 A 是半正定矩阵 (Positive Semidefinite Matrix)。
谱分解与几何含义
对称幂等矩阵的谱分解揭示了其最深刻的几何内涵。由谱定理,存在正交矩阵 Q 使得:
A=Q(Ir000)Q⊤,
其中 r=rank(A)。若记 Q=[Q1Q2],Q1∈Rn×r,则 A=Q1Q1⊤,而 Q1 的列张成了 Col(A) 的一组标准正交基。因此,Ax=Q1Q1⊤x 正是将 x 向 Col(A) 作正交投影的表达式。
这一定理表明:任何一个对称幂等矩阵都唯一地对应于一个投影子空间(即其列空间),且该投影是正交的。反过来,给定任意一个子空间 V⊆Rn,存在唯一一个对称幂等矩阵 PV 使得 Col(PV)=V,该矩阵即为向 V 的正交投影矩阵。
在统计学中的核心地位
对称幂等矩阵在数理统计与计量经济学中扮演着不可替代的角色,主要体现在以下三方面。
二次型的分布
设 y∼N(0,σ2In) 为标准正态向量,A 为对称幂等矩阵。则二次型 y⊤Ay/σ2∼χrank(A)2,即服从自由度为 rank(A) 的卡方分布。这一定理是方差分析 (ANOVA) 和回归诊断的数学基础。
Cochran 定理
Cochran 定理 (Cochran's Theorem) 是方差分析的基石。设 y∼N(μ,σ2In),且 A1,A2,…,Ak 为对称幂等矩阵,满足 ∑i=1kAi=In。则以下三个条件等价:各 Ai 两两正交(即 AiAj=0 对 i=j)、各二次型 y⊤Aiy 相互独立、各 y⊤Aiy/σ2 服从自由度为 rank(Ai) 的卡方分布。这为分割总平方和并检验各效应的显著性提供了严格的数学依据。
最小二乘估计与投影
在多元线性回归 y=Xβ+ε 中,普通最小二乘估计的\hat{β}对应的拟合值 y^=X(X⊤X)−1X⊤y。其中帽子矩阵 H=X(X⊤X)−1X⊤ 是一个对称幂等矩阵,它代表将观测向量 y 投影到 X 的列空间(即模型空间)上的正交投影。类似地,残差向量 ε^=y−y^=(In−H)y 的投影矩阵 In−H 也是对称幂等矩阵,它投影到模型空间的正交补(即残差空间)上。残差平方和 ε^⊤ε^=y⊤(In−H)y 正是使用对称幂等矩阵构造的二次型,其分布性质(在正态假设下服从卡方分布)支撑了整个回归推断体系。
矩阵运算中的封闭性
对称幂等矩阵在若干矩阵运算下保持封闭:
- 正交补:若 A 对称幂等,则 I−A 亦然。
- 直和:若 A 与 B 对称幂等且 AB=0(即投影到正交子空间),则 A+B 也是对称幂等矩阵,且 rank(A+B)=rank(A)+rank(B)。
- Kronecker 积:若 A 与 B 对称幂等,则 A⊗B 亦对称幂等,其秩为 rank(A)rank(B)。
此外,对称幂等矩阵的Frobenius 内积具有简洁表达:⟨A,B⟩F=tr(A⊤B)=tr(AB)。若 A 与 B 投影到正交子空间,则 tr(AB)=0。
与广义逆矩阵的关系
对称幂等矩阵与Moore-Penrose 广义逆 (Moore-Penrose Pseudoinverse) 密切相关。事实上,若 A 为对称幂等矩阵,则 A 自身就是其自身的广义逆:A=A+。更一般地,对于任意实矩阵 X,对称幂等矩阵 X(X⊤X)−1X⊤ 和 I−X(X⊤X)−1X⊤ 分别对应 X 的列空间及其正交补上的投影。
简单示例
考虑矩阵:
A=312−1−1−12−1−1−12,
易验 A⊤=A 且 A2=A,故 A 为对称幂等矩阵。其秩为 2,迹也为 2;特征值为 1,1,0。该矩阵将 R3 中的任意向量投影到平面 x1+x2+x3=0 上。I3−A=31111111111 则投影到该平面的法向量方向 (1,1,1)⊤ 上。
总体而言,对称幂等矩阵以其简洁的定义和丰富的数学结构,成为连接线性代数、几何直观与统计推断的关键桥梁。从最小二乘投影到卡方分布理论,从方差分析到主成分分析,这类矩阵为现代数据分析提供了不可或缺的理论工具。