ARTICLE

半负定矩阵

半负定矩阵 (Negative Semidefinite Matrix) 半负定矩阵是指一类特殊的对称(或Hermite矩阵)方阵,其对应的二次型取值恒非正。半负定矩阵在最优化理论、经济学、统计学和数值分析中扮演着关键角色——它刻画了凹函数的二阶条件,是确定极值性质、判断稳定性以及构造信赖域方法的基本工具。 定义 设 A R^n n 为一对称矩阵。若对所有非

浏览 0 更新 2025-12-20

半负定矩阵 (Negative Semidefinite Matrix)

半负定矩阵是指一类特殊的对称(或Hermite矩阵)方阵,其对应的二次型取值恒非正。半负定矩阵在最优化理论、经济学、统计学和数值分析中扮演着关键角色——它刻画了凹函数的二阶条件,是确定极值性质、判断稳定性以及构造信赖域方法的基本工具。

定义

ARn×n \mathbf{A} \in \mathbb{R}^{n \times n} 为一对称矩阵。若对所有非零向量 xRn \mathbf{x} \in \mathbb{R}^n ,均有

xAx0,\mathbf{x}^\top \mathbf{A} \mathbf{x} \leq 0,

则称 A \mathbf{A} 半负定矩阵(negative semidefinite matrix),记为 A0 \mathbf{A} \preceq 0

A \mathbf{A} 为 Hermite 矩阵(即 A=A \mathbf{A}^* = \mathbf{A} ),则条件相应地写为 xAx0 \mathbf{x}^* \mathbf{A} \mathbf{x} \leq 0 对所有 xCn \mathbf{x} \in \mathbb{C}^n 成立。

若不等号严格成立(xAx<0 \mathbf{x}^\top \mathbf{A} \mathbf{x} < 0 对所有 x0 \mathbf{x} \neq \mathbf{0} ),则称 A \mathbf{A} 负定矩阵(negative definite matrix),记为 A0 \mathbf{A} \prec 0 。半负定与负定的区别在于:半负定允许存在非零向量使二次型为零,而负定不允许。

等价刻画

半负定矩阵有以下彼此等价的刻画方式:

  • 特征值准则A \mathbf{A} 的所有特征值均为非正实数(λi0 \lambda_i \leq 0 )。这是最直接、应用最广的判定方法。由于 A \mathbf{A} 对称,其特征值全为实数;半负定性等价于最大特征值 λmax(A)0 \lambda_{\max}(\mathbf{A}) \leq 0
  • 主子式准则A \mathbf{A} 的所有奇数阶顺序主子式 0 \leq 0 ,所有偶数阶顺序主子式 0 \geq 0 。具体地,若记 Δk \Delta_k A \mathbf{A} k k 阶顺序主子式,则 (1)kΔk0 (-1)^k \Delta_k \geq 0 k=1,2,,n k = 1, 2, \dots, n 成立。这与半正定矩阵的判别形成对称:半正定时所有主子式非负。
  • 负半正定分解A=BB \mathbf{A} = -\mathbf{B}^\top \mathbf{B} ,其中 BRm×n \mathbf{B} \in \mathbb{R}^{m \times n} 为某矩阵。这一分解直接来自 Cholesky 分解的变体,适用于构造半负定矩阵。
  • Loewner 序:在Loewner序的意义下,A0 \mathbf{A} \preceq 0 等价于 A0 -\mathbf{A} \succeq 0 ,即负半定与半正定互为对偶。这一视角在矩阵不等式理论中尤为重要。

基本性质

  • 半负定矩阵的迹(trace)满足 tr(A)0 \operatorname{tr}(\mathbf{A}) \leq 0 ,且 tr(A)=0 \operatorname{tr}(\mathbf{A}) = 0 当且仅当 A=0 \mathbf{A} = \mathbf{0}
  • 半负定矩阵的行列式:当 n n 为奇数时 det(A)0 \det(\mathbf{A}) \leq 0 ,当 n n 为偶数时 det(A)0 \det(\mathbf{A}) \geq 0
  • 半负定矩阵的秩等于其非零特征值的个数(取绝对值)。
  • A0 \mathbf{A} \preceq 0 B0 \mathbf{B} \succeq 0 ,则 A+B \mathbf{A} + \mathbf{B} 的符号不定;但 A+C0 \mathbf{A} + \mathbf{C} \preceq 0 对任意 C0 \mathbf{C} \preceq 0 成立。
  • 半负定矩阵与半正定矩阵的 Kronecker 积仍为半正定矩阵。

与凹函数的关系

半负定矩阵在凸优化和经济学中的核心地位源于它与凹函数的深层联系。

f:RnR f: \mathbb{R}^n \to \mathbb{R} 为二次可微函数,其 Hessian 矩阵 2f(x) \nabla^2 f(\mathbf{x}) 在定义域内每一点处均为半负定矩阵,当且仅当 f f 凹函数(concave function)。类似地,f f 为凸函数当且仅当其 Hessian 半正定。

这一条件在经济学中有着广泛应用:生产函数在规模报酬递减区域的 Hessian 应为半负定;效用函数的凹性(即 Hessian 半负定)对应消费者的风险厌恶偏好;在微观经济学中,利润函数关于价格是凸函数(其 Hessian 半正定),而成本函数关于产出是凹函数(其 Hessian 半负定)。

在最优化中的应用

在半无限规划和非线性规划中,半负定矩阵用于刻画局部极大值的二阶充分条件:

x \mathbf{x}^* 满足一阶条件 f(x)=0 \nabla f(\mathbf{x}^*) = \mathbf{0} ,且 Hessian 矩阵 2f(x) \nabla^2 f(\mathbf{x}^*) 负定矩阵(严格半负定且满秩),则 x \mathbf{x}^* 为严格局部极大值点。若 Hessian 仅为半负定而非负定,则需要进一步检查高阶项才能确定极值性质。

在约束优化中,KKT条件的二阶充分条件涉及 Hessian 在约束切空间上的半负定性:若 Lagrangian 函数关于变量的 Hessian 在可行方向子空间上负定,则候选点为严格局部极大值。

实例

以下矩阵为半负定矩阵:

A=(1000),B=(2112),C=(4221).\mathbf{A} = \begin{pmatrix} -1 & 0 \\ 0 & 0 \end{pmatrix}, \quad \mathbf{B} = \begin{pmatrix} -2 & 1 \\ 1 & -2 \end{pmatrix}, \quad \mathbf{C} = \begin{pmatrix} -4 & -2 \\ -2 & -1 \end{pmatrix}.

验证 B \mathbf{B} :其特征值满足 det(BλI)=(2λ)21=λ2+4λ+3=0 \det(\mathbf{B} - \lambda \mathbf{I}) = (-2-\lambda)^2 - 1 = \lambda^2 + 4\lambda + 3 = 0 ,解得 λ1=1,λ2=3 \lambda_1 = -1, \lambda_2 = -3 ,均为负,故 B \mathbf{B} 为负定矩阵(从而也是半负定)。

验证 C \mathbf{C} det(C)=(4)(1)(2)(2)=44=0 \det(\mathbf{C}) = (-4)(-1) - (-2)(-2) = 4 - 4 = 0 ,且 C11=4<0 |\mathbf{C}_{11}| = -4 < 0 ,满足 (1)1(4)=40 (-1)^1 \cdot (-4) = 4 \geq 0 (1)20=00 (-1)^2 \cdot 0 = 0 \geq 0 ,故 C \mathbf{C} 为半负定而非负定。

与半正定矩阵的对偶性

半负定矩阵与半正定矩阵之间存在天然对偶:A0    A0 \mathbf{A} \preceq 0 \iff -\mathbf{A} \succeq 0 。这一对偶性使得所有关于半正定矩阵的结论(如 Cholesky 分解、Schur 补性质、特征值变分刻画)都可平移至半负定情形。在半定规划(SDP)中,约束条件 A(x)0 \mathbf{A}(\mathbf{x}) \preceq 0 等价于 A(x)0 -\mathbf{A}(\mathbf{x}) \succeq 0 ,从而可将问题转化为标准半定规划形式。

数值判定

在数值计算中,判断矩阵的半负定性通常通过计算其特征值或检查 Cholesky 分解的变体来实现。由于浮点误差,实践中并不要求严格 λi0 \lambda_i \leq 0 ,而是在给定容差 ϵ \epsilon 内检查 λmaxϵ \lambda_{\max} \leq \epsilon 。对于大规模稀疏矩阵,可使用 Lanczos 方法或 ARPACK 库仅计算最大特征值,若其为负(在容差内)则可判定为半负定。