半正定矩阵 (Positive Semi-definite Matrix)
半正定矩阵→线性代数核心概念→Hermitian矩阵(实域即对称矩阵)→推广实数"非负"至矩阵领域→二次型对任意非零向量恒非负→优化理论/统计学/控制论/机器学习基础工具。
定义
n×n Hermitian阵 M=M∗(M∗为共轭转置)半正定↔对所有非零 z∈Cn:z∗Mz≥0。该值为实数因(z∗Mz)∗=z∗M∗z=z∗Mz。实域→M=MT对称,对所有非零 x∈Rn:xTMx≥0。非对称矩阵正定性由其对称部分 21(A+AT) 决定:xTAx=xT2A+ATx,故讨论限制在对称/Hermitian矩阵。
等价判定方法
特征值判据(最重要):M半正定↔所有特征值λi≥0。证明核心:(⇒)取特征向量v=0,v∗Mv=λ∥v∥2≥0→λ≥0;(⇐)谱分解M=UΛU∗(U酉矩阵,Λ对角特征值阵),令y=U∗z→z∗Mz=∑i=1nλi∣yi∣2≥0。
Cholesky分解:M半正定↔存在下三角L使M=LL∗。正定矩阵时分解唯一,半正定时可不唯一→数值线性代数核心工具(解方程组、生成多元正态分布随机样本)。
主子式判据:M半正定↔所有主子式≥0(2n−1个)。关键陷阱:正定矩阵仅需顺序主子式>0(Sylvester判据),但半正定仅验顺序主子式非负不充分。经典反例:(000−1),顺序主子式D1=0,D2=0均非负,但一阶主子式M22=−1<0→特征值0,−1→非半正定。此区别是考试与应用的常见错误点。
与正定矩阵的系统对比
正定(PD)↔xTMx>0,特征值>0,可逆,椭球体,顺序主子式>0;半正定(PSD)↔xTMx≥0,特征值≥0,可能奇异(零特征值即不可逆),退化椭球(柱面、平面、或两平行超平面),所有主子式≥0。几何直观:二次型f(x)=xTMx定义二次曲面→PD时严格凸函数(碗形,唯一全局极小);PSD时凸函数但碗底可为平坦区域→最小值在M的核(Null Space)上多点达到→优化理论中Hessian矩阵半正定是局部极小的二阶必要条件。
核心应用场景
协方差矩阵:任意随机向量X,标量投影Y=aTX方差:Var(Y)=aTCov(X)a≥0恒成立→协方差矩阵必半正定。变量间无完全线性相关时正定→多元统计分析/计量经济学基础。
Gram矩阵:向量组{vi},Gij=⟨vi,vj⟩→G必半正定→核方法中核矩阵须满足半正定性(Mercer条件)→保证映射至合法再生核希尔伯特空间(RKHS)→SVM/高斯过程理论基石。
图拉普拉斯矩阵:L=D−A(D度矩阵,A邻接矩阵)→半正定→特征值0=λ1≤λ2≤⋯≤λn→λ2(代数连通度)反映图连通性强弱→谱聚类/图分割核心。
运算性质
PSD矩阵全体构成凸锥:A,B PSD→A+B PSD;c≥0→cA PSD。对角元非负(取x=ei即Mii≥0)。迹非负:Tr(M)=∑λi≥0。合同保持:M PSD→任意矩阵A,A∗MA半正定。存在唯一PSD平方根M1/2使M=M1/2M1/2→极分解/量子信息密度矩阵基础。