ARTICLE

正定矩阵

正定矩阵 (Positive Definite Matrix) 正定矩阵 (Positive Definite Matrix) 是线性代数中的一个核心概念,特指一类具有良好性质的埃尔米特矩阵(在实数域上则为对称矩阵)。一个矩阵被称为正定的,如果它与任何非零向量的"二次型"运算结果恒为正。"正定"(positive definite)这一术语由英国数学家詹姆斯

浏览 60 更新 2025-10-26

正定矩阵 (Positive Definite Matrix)

正定矩阵 (Positive Definite Matrix) 是线性代数中的一个核心概念,特指一类具有良好性质的埃尔米特矩阵(在实数域上则为对称矩阵)。一个矩阵被称为正定的,如果它与任何非零向量的"二次型"运算结果恒为正。"正定"(positive definite)这一术语由英国数学家詹姆斯·约瑟夫·西尔维斯特(James Joseph Sylvester)于19世纪引入,旨在将正数的概念推广至矩阵领域。这个概念在最优化理论、统计学、数值分析和物理学等领域中扮演着至关重要的角色。

严格来说,一个 n×n n \times n 的埃尔米特矩阵 A A (对于实数域,则为对称矩阵)是 正定 的,如果对于所有非零的复向量 xCn x \in \mathbb{C}^n (对于实数域,则为 xRn x \in \mathbb{R}^n x0 x \neq 0 ),都满足以下条件:

xAx>0x^{*} A x > 0

其中,x x^* 表示向量 x x 的共轭转置(conjugate transpose),在实数域中即为转置 xT x^T 。因此,对于实对称矩阵 A A ,其正定性条件为:

xTAx>0for all xRn,x0x^T A x > 0 \quad \text{for all } x \in \mathbb{R}^n, x \neq 0

表达式 xTAx x^T A x 被称为矩阵 A A 二次型。因此,一个实对称矩阵是正定的,当且仅当它的二次型对于任何非零实向量都取正值。

注意:非对称矩阵也可以定义正定性(即 xTAx>0 x^T A x > 0 ),但其性质主要由其对称部分 12(A+AT) \frac{1}{2}(A + A^T) 决定。因此,在讨论正定性时,通常默认研究的对象是对称矩阵或埃尔米特矩阵。

直观理解与类比

理解正定矩阵最有效的方式是将其类比为 正实数。在标量世界中,正数具有诸多优良特性(如存在正的平方根、其倒数也为正等)。正定矩阵就是这些特性在矩阵世界中的推广。

  • "正值"的推广:一个正数 a a 乘以任何非零数的平方 x2 x^2 总是正的(即 ax2>0 ax^2 > 0 )。类似地,一个正定矩阵 A A 与任何非零向量 x x 作用产生的二次型 xTAx x^T A x 总是正的。这个二次型可以被看作是向量在由矩阵 A A 定义的几何空间中的"能量"或"长度的平方"。从几何角度看,正定矩阵定义了一种内积结构 x,yA=xTAy \langle x, y \rangle_A = x^T A y ,使得原本的欧几里得空间变为一个带有新度量标准的内积空间。
  • "平方根"的推广:任何正数都有一个正的平方根。类似地,任何正定矩阵 A A 都有唯一的正定"平方根"矩阵 B B 使得 A=B2 A = B^2 。更常用的是,它存在唯一的Cholesky分解,即 A=LLT A = LL^T ,其中 L L 是一个对角线元素为正的下三角矩阵。这可以看作是矩阵的"平方根"分解,在数值计算中极为重要。

正定性的等价条件

在实践中,直接使用定义 xTAx>0 x^T A x > 0 来检验一个矩阵的正定性是困难的,因为它要求对所有非零向量 x x 进行验证。幸运的是,存在多个等价的、更易于操作的判断准则。对于一个 n×n n \times n 的实对称矩阵 A A ,以下条件是等价的:

  1. 所有特征值均为正:矩阵 A A 的所有 n n 个特征值 λ1,λ2,,λn \lambda_1, \lambda_2, \ldots, \lambda_n 都大于零。这是理论上最重要和最根本的属性。
  • 解释:由于 A A 是对称的,它可以被谱分解为 A=PDPT A = PDP^T ,其中 P P 是由特征向量构成的正交矩阵,D D 是由对应特征值构成的对角矩阵。那么二次型可以写作:
xTAx=xT(PDPT)x=(PTx)TD(PTx)x^T A x = x^T (PDP^T) x = (P^T x)^T D (P^T x)

y=PTx y = P^T x 。由于 P P 可逆,x0 x \neq 0 当且仅当 y0 y \neq 0 。于是上式变为:

yTDy=i=1nλiyi2y^T D y = \sum_{i=1}^n \lambda_i y_i^2

为了使该和式对于任何非零向量 y y 都为正,当且仅当所有的系数 λi \lambda_i 都必须为正。

  1. 所有顺序主子式均为正(Sylvester's Criterion):矩阵 A A 的所有顺序主子式的行列式都大于零。
  • 定义:顺序主子式是指由矩阵 A A 的左上角 k×k k \times k 子矩阵 (k=1,2,,n) (k=1, 2, \ldots, n) 构成的方阵。记其行列式为 Δk \Delta_k
Δ1=a11,Δ2=a11a12a21a22,,Δn=A\Delta_1 = |a_{11}|, \quad \Delta_2 = \begin{vmatrix} a_{11} & a_{12} \\ a_{21} & a_{22} \end{vmatrix}, \quad \ldots, \quad \Delta_n = |A|
  • 准则A A 是正定的当且仅当 Δk>0 \Delta_k > 0 对所有的 k=1,2,,n k=1, 2, \ldots, n 成立。这是一个非常实用的计算判据。
  1. 存在唯一的Cholesky分解:矩阵 A A 可以被唯一地分解为 A=LLT A = LL^T ,其中 L L 是一个对角线元素全为正的下三角矩阵。这种分解的存在性是 A A 为正定矩阵的充要条件。
  1. 矩阵可逆且其逆矩阵也为正定:如果 A A 是正定的,那么它的所有特征值都为正,因此特征值之积(即行列式)也为正,所以 A A 是可逆的。其逆矩阵 A1 A^{-1} 的特征值为 1/λi 1/\lambda_i ,也都为正,因此 A1 A^{-1} 也是正定的。

相关概念

正定矩阵是一系列"定性"矩阵中的一种。根据二次型 xTAx x^T A x 的符号,我们有如下分类:

  • 正半定矩阵(Positive Semi-definite Matrix):如果对于所有非零向量 x x ,有 xTAx0 x^T A x \ge 0 。这等价于矩阵的所有特征值均为非负数(0 \ge 0 )。正半定矩阵不一定是可逆的(当它有零特征值时)。
  • 负定矩阵(Negative Definite Matrix):如果对于所有非零向量 x x ,有 xTAx<0 x^T A x < 0 。这等价于所有特征值均为负数(<0 < 0 )。
  • 负半定矩阵(Negative Semi-definite Matrix):如果对于所有非零向量 x x ,有 xTAx0 x^T A x \le 0 。这等价于所有特征值均为非正数(0 \le 0 )。
  • 不定矩阵(Indefinite Matrix):如果 xTAx x^T A x 的值既可以为正也可以为负,这取决于向量 x x 的选择。这等价于矩阵既有正特征值也有负特征值。

应用领域

正定矩阵的概念之所以重要,是因为它在众多学科中都有着深刻的应用。

  • 最优化理论:在多元函数的微积分中,一个函数的黑塞矩阵(二阶偏导数组成的矩阵)在某一点的正定性,是判断该点为局部最小值的充分条件。这可以看作是单变量函数中二阶导数 f(x)>0 f''(x) > 0 判别法的推广。
  • 统计学与经济计量学:一个多维随机变量的协方差矩阵理论上总是正半定的。如果变量之间不存在多重共线性,那么协方差矩阵就是正定的。这反映了方差(或广义方差)不可能是负数的基本事实。
  • 机器学习:在核方法(如支持向量机)中,格拉姆矩阵(或核矩阵)必须是正半定的,这是确保所定义的核函数能够映射到一个合法的希尔伯特空间的必要条件。
  • 数值分析:在求解线性方程组 Ax=b Ax = b 时,如果 A A 是一个正定矩阵,那么可以使用如Cholesky分解或共轭梯度法等非常高效且数值稳定的算法进行求解。这在工程计算、物理模拟和大规模数据分析中具有重要的实践意义。

历史背景

正定矩阵的概念最早可以追溯到19世纪中叶。西尔维斯特在1852年发表了关于二次型的著名论文,提出了正定性的概念以及后来以其名字命名的判别准则。然而,西尔维斯特准则的严格证明是由后来的数学家完成的。正定矩阵理论的发展与二次型理论、谱理论和内积空间理论密切相关。20世纪初,希尔伯特将正定核的概念引入积分方程理论,进一步拓展了正定性的应用边界。如今,正定矩阵已成为数学、工程和经济学中不可或缺的分析工具,其理论深度和应用广度仍在持续扩展。