负定矩阵 (Negative Definite Matrix)是矩阵理论和线性代数中的一个核心概念,指所有非零向量经过二次型映射后取值恒为负的实对称矩阵。作为正定矩阵的"对偶"概念,负定矩阵在数学优化的极值判定、控制系统的稳定性分析、数值代数中的算法设计以及经济学模型的定性分析等多个领域都扮演着不可或缺的角色。
一、定义
设 M M M 为 n × n n \times n n × n 实对称矩阵(即满足 M = M T M = M^\mathsf{T} M = M T )。若对于任意非零列向量 x ∈ R n \mathbf{x} \in \mathbb{R}^n x ∈ R n ,其对应的二次型 x T M x \mathbf{x}^\mathsf{T} M \mathbf{x} x T M x 均满足严格不等式:
x T M x < 0 \mathbf{x}^\mathsf{T} M \mathbf{x} < 0 x T M x < 0
则称 M M M 为负定矩阵 。这里对"任意非零向量"的要求体现了定义的严格性——只要存在一个非零向量使二次型为零或正数,矩阵就不再是严格负定的。
与负定矩阵密切相关的是半负定矩阵 (Negative Semidefinite Matrix),其定义为:对于所有 x ∈ R n \mathbf{x} \in \mathbb{R}^n x ∈ R n (包括零向量)有 x T M x ≤ 0 \mathbf{x}^\mathsf{T} M \mathbf{x} \le 0 x T M x ≤ 0 ,且至少存在一个非零向量使等式成立。半负定矩阵允许特征值中存在零,而严格负定矩阵的所有特征值必须严格为负。
二、判定方法
判断一个实对称矩阵是否为负定矩阵,主要有以下几种经典方法。
1. 特征值判据
这是最本质、最直接的判定方法。实对称矩阵 M M M 为负定矩阵当且仅当其所有特征值均为负实数。设 λ 1 , λ 2 , … , λ n \lambda_1, \lambda_2, \dots, \lambda_n λ 1 , λ 2 , … , λ n 为 M M M 的全部特征值,则:
M 是负定矩阵 ⟺ λ i < 0 , ∀ i = 1 , 2 , … , n . M \text{ 是负定矩阵} \iff \lambda_i < 0,\quad \forall i = 1, 2, \dots, n. M 是负定矩阵 ⟺ λ i < 0 , ∀ i = 1 , 2 , … , n .
由于实对称矩阵的特征值均为实数,因此特征值的正负性具有明确的含义。这一判据在理论推导中极为便利,但对于高阶矩阵而言,直接计算特征值往往计算量较大,实际应用中更常采用其他判据。
2. 顺序主子式判据(赫尔维茨定理)
赫尔维茨定理给出了基于行列式的判定方法。设 M M M 为 n n n 阶实对称矩阵,记 Δ k \Delta_k Δ k 为其第 k k k 阶顺序主子式,即左上角 k × k k \times k k × k 子矩阵的行列式值。则 M M M 为负定矩阵当且仅当:
( − 1 ) k Δ k > 0 , k = 1 , 2 , … , n . (-1)^k \Delta_k > 0,\quad k = 1, 2, \dots, n. ( − 1 ) k Δ k > 0 , k = 1 , 2 , … , n .
展开来说,这意味着顺序主子式的符号严格交替变化:
Δ 1 < 0 , Δ 2 > 0 , Δ 3 < 0 , … \Delta_1 < 0,\quad \Delta_2 > 0,\quad \Delta_3 < 0,\quad \dots Δ 1 < 0 , Δ 2 > 0 , Δ 3 < 0 , …
且最后一个主子式 Δ n \Delta_n Δ n (即整个矩阵的行列式)的符号为 ( − 1 ) n (-1)^n ( − 1 ) n 。具体地,当 n n n 为奇数时 det ( M ) < 0 \det(M) < 0 det ( M ) < 0 ,当 n n n 为偶数时 det ( M ) > 0 \det(M) > 0 det ( M ) > 0 。
这一判据的优点在于只需要计算行列式,不涉及特征值的求解,计算过程相对简单。但需要注意,该判据仅适用于实对称矩阵。
3. 合同变换判据
若存在可逆矩阵 P P P 使得 P T M P = − I n P^\mathsf{T} M P = -I_n P T MP = − I n ,即 M M M 合同于负单位矩阵,则 M M M 为负定矩阵。更一般地,若 M M M 合同于一个对角线上全为负实数的对角矩阵,则 M M M 为负定矩阵。
这一判据揭示了负定矩阵与正定矩阵之间的内在联系:
M 负定 ⟺ − M 正定 . M \text{ 负定} \iff -M \text{ 正定}. M 负定 ⟺ − M 正定 .
因此,所有关于正定矩阵的理论结果都可以通过取负号直接转化为负定矩阵的对应性质。
4. 楚列斯基分解判据
对于实对称矩阵 M M M ,若 − M -M − M 存在楚列斯基分解(Cholesky decomposition),即存在下三角矩阵 L L L 使得 − M = L L T -M = LL^\mathsf{T} − M = L L T ,且 L L L 的对角线元素均为正实数,则 M M M 为负定矩阵。这一判据在数值计算中应用广泛。
三、基本性质
负定矩阵具有以下重要性质:
与正定矩阵的关系 :M M M 是负定矩阵 ⟺ \iff ⟺ − M -M − M 是正定矩阵。这是理解负定矩阵最为关键的性质,它意味着我们可以将正定矩阵的所有已知性质通过取负号迁移到负定矩阵上。
可逆性 :负定矩阵必然可逆。这是因为所有特征值均为非零实数(严格为负),而行列式等于特征值的乘积,故 det ( M ) ≠ 0 \det(M) \neq 0 det ( M ) = 0 。事实上,负定矩阵的逆矩阵也是负定矩阵。
对角线元素 :负定矩阵的主对角线元素全部为负数,即 m i i < 0 m_{ii} < 0 m ii < 0 。证明十分简单:取 x \mathbf{x} x 为单位向量 e i = ( 0 , … , 1 , … , 0 ) T \mathbf{e}_i = (0, \dots, 1, \dots, 0)^\mathsf{T} e i = ( 0 , … , 1 , … , 0 ) T ,则有 e i T M e i = m i i < 0 \mathbf{e}_i^\mathsf{T} M \mathbf{e}_i = m_{ii} < 0 e i T M e i = m ii < 0 。但需要注意,对角线元素全为负只是负定矩阵的必要条件而非充分条件。
特征值性质 :所有特征值均为负实数。由此可知负定矩阵的迹(特征值之和)为负,即 tr ( M ) < 0 \operatorname{tr}(M) < 0 tr ( M ) < 0 。
行列式的符号 :det ( M ) > 0 \det(M) > 0 det ( M ) > 0 当 n n n 为偶数时,det ( M ) < 0 \det(M) < 0 det ( M ) < 0 当 n n n 为奇数时。
封闭性 :两个负定矩阵的和仍为负定矩阵。若 A , B A, B A , B 均为负定矩阵,则 A + B A + B A + B 也是负定矩阵。但两个负定矩阵的乘积一般不是负定矩阵(也不一定对称)。
与数乘的关系 :若 M M M 为负定矩阵且 c > 0 c > 0 c > 0 为正实数,则 c M cM c M 仍为负定矩阵。若 c < 0 c < 0 c < 0 ,则 c M cM c M 变为正定矩阵。
四、详细示例
例 1(对角矩阵) : 考虑矩阵 M = [ − 2 0 0 − 3 ] M = \begin{bmatrix} -2 & 0 \\ 0 & -3 \end{bmatrix} M = [ − 2 0 0 − 3 ] 。 验证负定性:
特征值法:λ 1 = − 2 < 0 \lambda_1 = -2 < 0 λ 1 = − 2 < 0 ,λ 2 = − 3 < 0 \lambda_2 = -3 < 0 λ 2 = − 3 < 0 ,全部为负,故 M M M 负定。 顺序主子式法:Δ 1 = − 2 < 0 \Delta_1 = -2 < 0 Δ 1 = − 2 < 0 ,Δ 2 = 6 > 0 \Delta_2 = 6 > 0 Δ 2 = 6 > 0 ,满足 ( − 1 ) 1 Δ 1 = 2 > 0 (-1)^1\Delta_1 = 2 > 0 ( − 1 ) 1 Δ 1 = 2 > 0 和 ( − 1 ) 2 Δ 2 = 6 > 0 (-1)^2\Delta_2 = 6 > 0 ( − 1 ) 2 Δ 2 = 6 > 0 。 对角线元素:m 11 = − 2 < 0 m_{11} = -2 < 0 m 11 = − 2 < 0 ,m 22 = − 3 < 0 m_{22} = -3 < 0 m 22 = − 3 < 0 。
例 2(非对角矩阵) : 考虑矩阵 N = [ − 2 1 1 − 2 ] N = \begin{bmatrix} -2 & 1 \\ 1 & -2 \end{bmatrix} N = [ − 2 1 1 − 2 ] 。
特征值法:特征方程为 det ( N − λ I ) = ( − 2 − λ ) 2 − 1 = λ 2 + 4 λ + 3 = 0 \det(N - \lambda I) = (-2-\lambda)^2 - 1 = \lambda^2 + 4\lambda + 3 = 0 det ( N − λ I ) = ( − 2 − λ ) 2 − 1 = λ 2 + 4 λ + 3 = 0 ,解得 λ 1 = − 1 < 0 \lambda_1 = -1 < 0 λ 1 = − 1 < 0 ,λ 2 = − 3 < 0 \lambda_2 = -3 < 0 λ 2 = − 3 < 0 ,故 N N N 负定。 顺序主子式法:Δ 1 = − 2 < 0 \Delta_1 = -2 < 0 Δ 1 = − 2 < 0 ,Δ 2 = 4 − 1 = 3 > 0 \Delta_2 = 4 - 1 = 3 > 0 Δ 2 = 4 − 1 = 3 > 0 ,符号交替满足条件。
例 3(非负定矩阵的反例) : 考虑矩阵 Q = [ − 2 0 0 1 ] Q = \begin{bmatrix} -2 & 0 \\ 0 & 1 \end{bmatrix} Q = [ − 2 0 0 1 ] 。 取 x = ( 0 , 1 ) T \mathbf{x} = (0, 1)^\mathsf{T} x = ( 0 , 1 ) T ,则 x T Q x = 1 > 0 \mathbf{x}^\mathsf{T} Q \mathbf{x} = 1 > 0 x T Q x = 1 > 0 ,故 Q Q Q 不是负定矩阵。其特征值 λ 1 = − 2 \lambda_1 = -2 λ 1 = − 2 ,λ 2 = 1 \lambda_2 = 1 λ 2 = 1 一正一负,为不定矩阵。
例 4(三阶矩阵) : 考虑矩阵 R = [ − 3 1 0 1 − 4 1 0 1 − 2 ] R = \begin{bmatrix} -3 & 1 & 0 \\ 1 & -4 & 1 \\ 0 & 1 & -2 \end{bmatrix} R = − 3 1 0 1 − 4 1 0 1 − 2 。 顺序主子式:Δ 1 = − 3 < 0 \Delta_1 = -3 < 0 Δ 1 = − 3 < 0 ,Δ 2 = 12 − 1 = 11 > 0 \Delta_2 = 12 - 1 = 11 > 0 Δ 2 = 12 − 1 = 11 > 0 ,Δ 3 = det ( R ) = ( − 3 ) ( 8 − 1 ) − 1 ( − 2 − 0 ) + 0 = − 21 + 2 = − 19 < 0 \Delta_3 = \det(R) = (-3)(8-1) - 1(-2-0) + 0 = -21 + 2 = -19 < 0 Δ 3 = det ( R ) = ( − 3 ) ( 8 − 1 ) − 1 ( − 2 − 0 ) + 0 = − 21 + 2 = − 19 < 0 。 验证 ( − 1 ) k Δ k (-1)^k\Delta_k ( − 1 ) k Δ k :( − 1 ) 1 ( − 3 ) = 3 > 0 (-1)^1(-3)=3>0 ( − 1 ) 1 ( − 3 ) = 3 > 0 ,( − 1 ) 2 ( 11 ) = 11 > 0 (-1)^2(11)=11>0 ( − 1 ) 2 ( 11 ) = 11 > 0 ,( − 1 ) 3 ( − 19 ) = 19 > 0 (-1)^3(-19)=19>0 ( − 1 ) 3 ( − 19 ) = 19 > 0 ,全部为正,故 R R R 为负定矩阵。
五、应用领域
1. 优化理论
在多元函数极值问题中,海森矩阵(Hessian Matrix)的定性起着决定性作用。对于二阶连续可微函数 f : R n → R f: \mathbb{R}^n \to \mathbb{R} f : R n → R ,若其在驻点 x ∗ \mathbf{x}^* x ∗ 处的海森矩阵 ∇ 2 f ( x ∗ ) \nabla^2 f(\mathbf{x}^*) ∇ 2 f ( x ∗ ) 为负定矩阵,则 x ∗ \mathbf{x}^* x ∗ 是严格局部极大值点;若海森矩阵为半负定,则可能是局部极大值点(需要进一步分析高阶项)。当海森矩阵在定义域内处处负定时,函数为严格凹函数,此时驻点即为全局极大值点。
在约束优化中,负定矩阵出现在拉格朗日函数的二阶充分条件中,用于判定不等式约束问题中的局部极大值点。
2. 控制理论与李雅普诺夫稳定性
在控制系统的稳定性分析中,负定矩阵是李雅普诺夫直接法的核心工具。考虑线性定常系统 x ˙ = A x \dot{\mathbf{x}} = A\mathbf{x} x ˙ = A x ,若存在对称正定矩阵 P P P 使得 A T P + P A A^\mathsf{T}P + PA A T P + P A 为负定矩阵,则系统是渐近稳定的。这一条件等价于存在负定矩阵 Q = A T P + P A Q = A^\mathsf{T}P + PA Q = A T P + P A ,其负定性保证了李雅普诺夫函数 V ( x ) = x T P x V(\mathbf{x}) = \mathbf{x}^\mathsf{T}P\mathbf{x} V ( x ) = x T P x 沿系统轨线的导数严格为负,从而能量持续衰减至平衡点。
3. 经济学
在微观经济学中,消费者的斯卢茨基替代矩阵(Slutsky Substitution Matrix)的负半定性是理性消费行为的必要条件。这一性质来源于支出函数对于价格的凹性,是消费者理论中显示性偏好弱公理的代数表达。在生产者理论中,生产函数的二阶导数矩阵(即生产函数的海森矩阵)的负定性对应着规模报酬递减和边际生产率递减等基本经济规律。
4. 数值分析
在数值代数中,负定矩阵出现在某些迭代法的收敛性分析中。对于负定系数矩阵的线性方程组,特定的迭代方法具有保证收敛的性质。此外,在信赖域方法(Trust Region Method)中,子问题的求解涉及对海森矩阵进行修正以保证其负定性,从而获得正确的搜索方向。
六、与其他概念的关系
正定矩阵 (Positive Definite Matrix):所有特征值大于零的对称矩阵。负定矩阵与正定矩阵通过 M ↔ − M M \leftrightarrow -M M ↔ − M 构成一一对应关系。半负定矩阵 (Negative Semidefinite Matrix):特征值全部非正(≤ 0 \le 0 ≤ 0 ),且至少有一个零特征值。半负定允许二次型在非零向量处取零值。不定矩阵 (Indefinite Matrix):同时具有正特征值和负特征值的对称矩阵。不定矩阵对应鞍点,在优化中出现在非凸问题的海森矩阵中。西尔维斯特惯性定律 (Sylvester's Law of Inertia):实对称矩阵在合同变换下保持正特征值个数、负特征值个数和零特征值个数不变。这一定律为矩阵的定性分类提供了理论基础,也是用合同变换判定矩阵负定性的理论保障。
参考文献
Horn, R. A., \& Johnson, C. R. (2012). *Matrix Analysis* (2nd ed.). Cambridge University Press. Boyd, S., \& Vandenberghe, L. (2004). *Convex Optimization*. Cambridge University Press. Strang, G. (2016). *Introduction to Linear Algebra* (5th ed.). Wellesley-Cambridge Press. 张贤达 (2013). *矩阵分析与应用* (第2版). 清华大学出版社.
关于知经 KNOWECON
知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌,长期面向北京大学、清华大学、中国人民大学等顶尖院校,提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考,并成功进入理想院校。
知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业,获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者,长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。
我们相信,好的考研辅导不只是押题和陪跑,更是把复杂知识讲清楚、把复习路径设计清楚,并用技术让学习过程更可追踪、更可反馈、更可坚持。