ARTICLE

负定

负定 (Negative Definite) 负定(negative definite)是线性代数与最优化理论中的核心概念,描述一个实对称矩阵或二次型在任意非零输入下恒取严格负值的性质。它在数学上是正定的完美镜像,在最优化中为极大值的二阶充分条件提供判定依据,在经济学中是严格凹性与边际替代率递减的代数基础,在动力系统中则是渐近稳定性的关键判据。负定概念植根于

浏览 6 更新 2026-01-16

负定 (Negative Definite)

负定(negative definite)是线性代数最优化理论中的核心概念,描述一个实对称矩阵或二次型在任意非零输入下恒取严格负值的性质。它在数学上是正定的完美镜像,在最优化中为极大值的二阶充分条件提供判定依据,在经济学中是严格凹性与边际替代率递减的代数基础,在动力系统中则是渐近稳定性的关键判据。负定概念植根于十九世纪数学家对二次型分类的系统研究,经由SylvesterJacobi等人的工作,已渗透至纯数学、应用数学、物理学与社会科学的几乎所有定量分支。

定义与基本性质

ARn×nA \in \mathbb{R}^{n \times n} 为实对称矩阵(A=ATA = A^{\mathsf{T}})。若对任意非零向量 xRn{0}x \in \mathbb{R}^n \setminus \{0\},其二次型满足

xTAx<0x^{\mathsf{T}} A x < 0

则称 AA负定矩阵,相应的二次型 Q(x)=xTAxQ(x) = x^{\mathsf{T}} A x 称为负定二次型

定义的一个直接推论是:负定矩阵的对角元必须全为严格负数。取标准基向量 x=eix = e_i(第 ii 个分量为 1、其余为零),则 eiTAei=aii<0e_i^{\mathsf{T}} A e_i = a_{ii} < 0。这是负定的必要条件,但远非充分——仅对角元为负不足以保证矩阵负定。

负定与正定之间由简单的负号映射建立一一对应:

A 负定     A 正定 A \text{ 负定 } \iff -A \text{ 正定 }

这一对偶关系意味着负定理论几乎完全平行于正定理论:正定的每条结论只需添加一个负号即可翻译为负定的对应结论。然而,"负定"决不可与"非正定"混淆。非正定仅意味着 xTAxx^{\mathsf{T}} A x 不恒大于零,容许取零或变号;负定要求恒严格小于零,是远更强的条件。

负定矩阵构成实数域上的一个开凸锥:若 A,BA, B 均为负定,则对任意 α,β>0\alpha, \beta > 0αA+βB\alpha A + \beta B 亦为负定。此外,负定矩阵必为非奇异——若 AA 负定而存在 x0x \neq 0 使 Ax=0Ax = 0,则 xTAx=0x^{\mathsf{T}} A x = 0,与严格负定性矛盾。其行列式的符号为 (1)n(-1)^n 乘以某个正数,故偶数阶负定矩阵的行列式为正,奇数阶为负。

等价判据与 Sylvester 准则

判断一个对称矩阵是否负定,有三种常用的等价方法,各有其适用场景。

(1) 特征值判据。 AA 负定当且仅当其所有特征值均严格小于零:λ1λ2λn<0\lambda_1 \leq \lambda_2 \leq \cdots \leq \lambda_n < 0。这是最直接的判据:由谱分解 A=QΛQTA = Q \Lambda Q^{\mathsf{T}}QQ 为正交矩阵),二次型化为 xTAx=(QTx)TΛ(QTx)=i=1nλiyi2x^{\mathsf{T}} A x = (Q^{\mathsf{T}} x)^{\mathsf{T}} \Lambda (Q^{\mathsf{T}} x) = \sum_{i=1}^n \lambda_i y_i^2,符号完全由 λi\lambda_i 决定。此判据概念通透但在手算中不实用——求特征值本身即需解 nn 次特征方程。

(2) 顺序主子式判据(负定版 Sylvester 准则)。AkA_kAA 的左上 k×kk \times k 顺序主子矩阵,Δk=det(Ak)\Delta_k = \det(A_k) 为第 kk 阶顺序主子式。则 AA 负定当且仅当顺序主子式的符号严格交替,且从负号开始:

(1)kΔk>0,k=1,2,,n(-1)^k \Delta_k > 0, \quad k = 1, 2, \ldots, n

亦即 Δ1<0\Delta_1 < 0Δ2>0\Delta_2 > 0Δ3<0\Delta_3 < 0Δ4>0\Delta_4 > 0 \ldots 依此类推。与正定情形(所有 Δk>0\Delta_k > 0)形成整齐对照。此判据在手工计算中最为实用:仅需计算 nn 个行列式并验符号。但需注意,该准则仅适用于顺序主子式——任意主子式满足符号交替条件是负定的充分必要条件(完整 Sylvester 条件),涉及 2n12^n - 1 个子矩阵,理论完备但实际繁复。

(3) LDLTLDL^{\mathsf{T}} 分解判据。 对称矩阵可分解为 A=LDLTA = L D L^{\mathsf{T}},其中 LL 为单位下三角矩阵,D=diag(d1,,dn)D = \operatorname{diag}(d_1, \ldots, d_n) 为对角矩阵。则 AA 负定当且仅当 DD 的所有对角元 di<0d_i < 0。此判据数值稳定且计算量为 O(n3/3)O(n^3/3),是现代软件实现的首选方法。类似地,尝试 Cholesky 分解 A=GGT-A = G G^{\mathsf{T}} 是否成功,亦可判定负定性——但需业务上显式构造 A-A

负半定矩阵

若条件放宽为对任意 xRnx \in \mathbb{R}^nxTAx0x^{\mathsf{T}} A x \leq 0(允许为零),则称 AA负半定矩阵(negative semidefinite)。相应的等价判据为:所有特征值 0\leq 0;所有主子式满足 (1)kdet0(-1)^k \det \geq 0(允许取零);LDLTLDL^{\mathsf{T}} 分解中 di0d_i \leq 0

负半定是负定的闭包:当某些特征值恰好为零时,矩阵仅半定而不严格。在几何上,负定二次型在 Rn\mathbb{R}^n 中刻画的是开口向下的椭球等值面;负半定则对应于退化的开口向下抛物柱面或更低维的负定子空间——存在某些方向二次型恒为零,沿这些方向函数曲率为零,极值判定失效。

两者的关系类似正数与负数的关系之于非负数与非正数:严格情形给出唯一极值的充分条件,半定情形仅给出必要条件或边界情形。

最优化中的二阶条件

负定矩阵在无约束最优化中扮演核心角色。设 f:RnRf: \mathbb{R}^n \to \mathbb{R}C2C^2 函数,xx^* 为驻点(f(x)=0\nabla f(x^*) = 0):

  • Hesse矩阵 Hf(x)H_f(x^*) 负定,则 xx^*严格局部极大点
  • Hf(x)H_f(x^*) 负半定,则 xx^* 可能是极大点,但需更高阶 Taylor 项确认。
  • Hf(x)H_f(x^*) 不定(同时具有正、负特征值),则 xx^*鞍点——在某些方向上升、某些方向下降。

其原理来自二阶 Taylor 展开。在驻点附近:

f(x+d)=f(x)+12dTHf(x)d+o(d2)f(x^* + d) = f(x^*) + \frac{1}{2} d^{\mathsf{T}} H_f(x^*) d + o(\|d\|^2)

当 Hesse 矩阵负定时,对任意扰动方向 d0d \neq 0,二次项为负且支配高阶无穷小,函数值必下降,故 xx^* 为局部极大。此逻辑根植于 Rayleigh 商的极值刻画:R(d)=dTHfddTdR(d) = \frac{d^{\mathsf{T}} H_f d}{d^{\mathsf{T}} d} 介于最小与最大特征值之间,负定保证最大特征值仍为负,故所有方向均下降。

在约束优化中,负定性进入加边 Hesse 矩阵的符号判定。对于等式约束问题 maxf(x) s.t. g(x)=0\max f(x) \text{ s.t. } g(x) = 0,构造拉格朗日函数 L(x,λ)=f(x)λTg(x)\mathcal{L}(x, \lambda) = f(x) - \lambda^{\mathsf{T}} g(x),其加边 Hesse 矩阵

\bar{H} = \begin{bmatrix}

0 \& \nabla g^{\mathsf{T}} \\ \nabla g \& \nabla\_{xx}^2 L\mathcal{L}

\end{bmatrix}

的特定主子式符号条件(加边主子式交替符号)给出约束极大值的二阶充分条件。此方法在经济学中普遍应用于效用最大化(预算约束下)与成本最小化(产出约束下)的验证。

经济学中的应用

负定与负半定在经济学理论中无处不在,是凹性假设的代数化身。

消费者理论。 效用函数 U(x)U(x) 为严格凹函数当且仅当其 Hesse 矩阵在消费集上处处负定。严格凹性蕴含边际替代率递减——无差异曲线严格凸向原点——从而保证需求函数为单值且连续,且一阶条件(边际替代率等于价格比)确实给出效用极大值而非极小值。若效用的 Hesse 矩阵仅为负半定(拟凹性),则需求可能为集值对应而非函数,分析复杂度骤增。

厂商理论。 在完全竞争市场中,利润最大化的一阶条件为边际产品价值等于要素价格。二阶条件要求生产函数在最优投入处的 Hesse 矩阵负定——这正是递减规模报酬的局部表达。若 Hesse 矩阵不定,则一阶条件可能落在鞍点或极小点,经典边际生产力分配理论将失去基础。成本函数关于投入价格的凹性等价于条件要素需求矩阵的负半定性:要素需求关于自身价格的斜率非正(替代矩阵负半定),这是 Shephard 引理的直接推论。

计量经济学。极大似然估计(MLE)中,对数似然函数 (θ)\ell(\theta) 在真参数 θ0\theta_0 处的 Hesse 矩阵期望值为负定。事实上,Fisher 信息矩阵 I(θ0)=E[2(θ0)]\mathcal{I}(\theta_0) = -\mathbb{E}[\nabla^2 \ell(\theta_0)] 的正定性恰好对偶于 Hesse 期望的负定性。负定性确保了似然函数在真值处有唯一的局部极大值,是 MLE 渐近识别性与有效性的必要前提。实际估计中,若数值 Hesse 矩阵接近奇异(特征值接近零),则提示识别不足或共线性问题。

博弈论。 在势博弈(potential game)与单调博弈分析中,势函数在纳什均衡处的 Hesse 矩阵负定性对应着均衡的局部唯一性与最优反应动态下的渐近稳定性。具体而言,若势函数在均衡处负定,则最优反应映射为局部收缩,迭代最优反应过程收敛。

动力系统与 Lyapunov 稳定性

负定性在微分方程的稳定性理论中是 Lyapunov 第二方法的代数核心。对于自治系统 x˙=f(x)\dot{x} = f(x)f(0)=0f(0) = 0),若能构造一个标量函数 V(x)V(x)(Lyapunov 函数)满足:V(0)=0V(0) = 0V(x)>0V(x) > 0x0x \neq 0,且沿系统轨线的导数 V˙(x)=V(x)Tf(x)\dot{V}(x) = \nabla V(x)^{\mathsf{T}} f(x) 负定(即 V˙(x)<0\dot{V}(x) < 0 对所有 x0x \neq 0),则原点渐近稳定。此处要求的是 V˙\dot{V} 的负定性而非 VV 自身的负定性,二者恰成对偶——VV 为正定,V˙\dot{V} 为负定,共同构成稳定性判定的黄金组合。

对于线性系统 x˙=Mx\dot{x} = M x,原点渐近稳定的充要条件是存在负定矩阵 PP 使得 Lyapunov 方程 MTP+PM=QM^{\mathsf{T}} P + P M = -Q 对某正定矩阵 QQ 成立。此方程解 PP 为负定当且仅当 MM 的所有特征值具负实部(Hurwitz 稳定),从而在负定性、特征值符号与矩阵指数衰减之间建立三角等价:MM 稳定     \iff 存在负定 PP     \iff limtetM=0\lim_{t \to \infty} e^{tM} = 0

数值判定与实现

在实际计算中,判定一个对称矩阵是否负定的常用数值流程如下:首先尝试 LDLTLDL^{\mathsf{T}} 分解——若对角矩阵 DD 的所有对角元严格为负,则矩阵负定;若出现 di0d_i \geq 0,可进一步计算几个最大特征值以确认是否为半定或不定。在迭代优化(如牛顿法求极大值)中,若 Hesse 矩阵不再负定(出现正特征值),常见修正策略为向对角元添加负的倍数 (τI\tau I with τ<0\tau < 0),强制恢复负定性以维持下降方向——此即 Levenberg-Marquardt 类修正的精髓。

拟牛顿法(如 BFGS 的极大化变体)通过秩二更新公式,以低秩累进的方式逼近真实 Hesse 矩阵,并刻意维持迭代矩阵的负定性,从而在每步保障搜索方向为上升方向、收敛到极大值。