ARTICLE

半正定矩阵

半正定矩阵 (Positive Semi-definite Matrix) 半正定矩阵→线性代数核心概念→Hermitian矩阵(实域即对称矩阵)→推广实数"非负"至矩阵领域→二次型对任意非零向量恒非负→优化理论/统计学/控制论/机器学习基础工具。 定义 n n Hermitian阵 M=M^* ( M^* 为共轭转置)半正定↔对所有非零 z C^n :z^

浏览 57 更新 2025-10-26

半正定矩阵 (Positive Semi-definite Matrix)

半正定矩阵线性代数核心概念→Hermitian矩阵(实域即对称矩阵)→推广实数"非负"至矩阵领域→二次型对任意非零向量恒非负→优化理论/统计学/控制论/机器学习基础工具。

定义

n×n n\times n Hermitian阵 M=M M=M^* M M^* 共轭转置)半正定↔对所有非零 zCn z\in\mathbb{C}^n zMz0z^*Mz\ge 0。该值为实数因(zMz)=zMz=zMz (z^*Mz)^*=z^*M^*z=z^*Mz 。实域→M=MT M=M^T 对称,对所有非零 xRn x\in\mathbb{R}^n xTMx0x^TMx\ge 0。非对称矩阵正定性由其对称部分 12(A+AT)\frac12(A+A^T) 决定:xTAx=xTA+AT2xx^TAx=x^T\frac{A+A^T}{2}x,故讨论限制在对称/Hermitian矩阵。

等价判定方法

特征值判据(最重要):M M 半正定↔所有特征值λi0\lambda_i\ge 0。证明核心:(⇒)取特征向量v0 v\neq 0 vMv=λv20v^*Mv=\lambda\|v\|^2\ge0λ0\lambda\ge0;(⇐)谱分解M=UΛU M=U\Lambda U^* U U 酉矩阵Λ \Lambda 对角特征值阵),令y=Uz y=U^*z zMz=i=1nλiyi20z^*Mz=\sum_{i=1}^n\lambda_i|y_i|^2\ge 0

Cholesky分解M M 半正定↔存在下三角L L 使M=LL M=LL^* 正定矩阵时分解唯一,半正定时可不唯一→数值线性代数核心工具(解方程组、生成多元正态分布随机样本)。

主子式判据M M 半正定↔所有主子式0\ge 02n1 2^n-1 个)。关键陷阱正定矩阵仅需顺序主子式>0 >0 Sylvester判据),但半正定仅验顺序主子式非负不充分。经典反例:(0001)\begin{pmatrix}0&0\\0&-1\end{pmatrix},顺序主子式D1=0,D2=0 D_1=0,D_2=0 均非负,但一阶主子式M22=1<0 M_{22}=-1<0 →特征值0,1 0,-1 →非半正定。此区别是考试与应用的常见错误点。

与正定矩阵的系统对比

正定(PD)↔xTMx>0x^TMx>0,特征值>0 >0 ,可逆,椭球体,顺序主子式>0 >0 ;半正定(PSD)↔xTMx0x^TMx\ge 0,特征值0\ge 0,可能奇异(零特征值即不可逆),退化椭球(柱面、平面、或两平行超平面),所有主子式0\ge 0。几何直观:二次型f(x)=xTMx f(x)=x^TMx 定义二次曲面→PD时严格凸函数(碗形,唯一全局极小);PSD时凸函数但碗底可为平坦区域→最小值在M M (Null Space)上多点达到→优化理论Hessian矩阵半正定是局部极小的二阶必要条件

核心应用场景

协方差矩阵:任意随机向量X X ,标量投影Y=aTX Y=a^TX 方差:Var(Y)=aTCov(X)a0\text{Var}(Y)=a^T\text{Cov}(X)a\ge 0恒成立→协方差矩阵必半正定。变量间无完全线性相关时正定→多元统计分析/计量经济学基础。

Gram矩阵:向量组{vi} \{v_i\} Gij=vi,vjG_{ij}=\langle v_i,v_j\rangleG G 必半正定→核方法核矩阵须满足半正定性(Mercer条件)→保证映射至合法再生核希尔伯特空间(RKHS)→SVM/高斯过程理论基石。

拉普拉斯矩阵L=DA L=D-A D D 度矩阵,A A 邻接矩阵)→半正定→特征值0=λ1λ2λn 0=\lambda_1\le\lambda_2\le\cdots\le\lambda_n λ2 \lambda_2 (代数连通度)反映图连通性强弱→谱聚类/图分割核心。

运算性质

PSD矩阵全体构成凸锥A,B A,B PSD→A+B A+B PSD;c0 c\ge 0 cA cA PSD。对角元非负(取x=ei x=e_i Mii0 M_{ii}\ge 0 )。迹非负:Tr(M)=λi0\text{Tr}(M)=\sum\lambda_i\ge 0。合同保持:M M PSD→任意矩阵A A AMAA^*MA半正定。存在唯一PSD平方根M1/2 M^{1/2} 使M=M1/2M1/2 M=M^{1/2}M^{1/2} 极分解/量子信息密度矩阵基础。