ARTICLE

不定矩阵

不定矩阵(Indefinite Matrix)是指对称(或 Hermite)矩阵 A 满足:其对应的二次型 x^ T A x 既可以为正也可以为负,具体取值取决于非零向量 x 的选择。等价地, A 的特征值中既有正值也有负值。不定矩阵是除正定、半正定、负定、半负定之外的第五种也是最后一种对称矩阵类型。 定义 设 A R^n n 为对称矩阵。若存在向量 x,

浏览 9 更新 2025-10-26

不定矩阵(Indefinite Matrix)是指对称(或 Hermite)矩阵 A A 满足:其对应的二次型 xTAx x^{\mathsf{T}} A x 既可以为正也可以为负,具体取值取决于非零向量 x x 的选择。等价地,A A 的特征值中既有正值也有负值。不定矩阵是除正定、半正定、负定、半负定之外的第五种也是最后一种对称矩阵类型。

定义

ARn×n A \in \mathbb{R}^{n \times n} 为对称矩阵。若存在向量 x,yRn x, y \in \mathbb{R}^n 使得

xTAx>0yTAy<0,x^{\mathsf{T}} A x > 0 \quad \text{且} \quad y^{\mathsf{T}} A y < 0,

则称 A A 不定矩阵。这等价于 A A 的特征值集合 {λ1,λ2,,λn} \{\lambda_1, \lambda_2, \dots, \lambda_n\} 同时包含正数和负数。如果矩阵不是对称的,通常先考虑其对称部分 (A+AT)/2 (A + A^{\mathsf{T}})/2 来判断二次型的符号特征。

对于 Hermite 矩阵(复对称矩阵),定义类似:若存在非零复向量 x,y x, y 使得 xAx>0 x^* A x > 0 yAy<0 y^* A y < 0 ,则 A A 为不定矩阵。

判定方法

除直接计算特征值符号外,还有以下实用判据:

顺序主子式法:对于对称矩阵 A A ,若存在奇数阶顺序主子式为负,且偶数阶顺序主子式为正(即不满足正定或负定的符号模式),则 A A 可能为不定矩阵。但此方法仅适用于对称矩阵,且要求所有顺序主子式非零。当主子式为零时,需要借助更精细的分析。

Sylvester惯性定律:矩阵的惯性指数(正特征值个数 n+ n_+ 、负特征值个数 n n_- 、零特征值个数 n0 n_0 )在合同变换下保持不变。因此通过合同对角化 A=PDPT A = PDP^{\mathsf{T}} 后,若 D D 既含有正元也含有负元,即可判定 A A 为不定矩阵。

LDL^T 分解:若 A=LDLT A = LDL^{\mathsf{T}} 的对角阵 D D 同时含有正元和负元,则 A A 为不定矩阵。这一分解避免了显式计算特征值,计算复杂度为 O(n3) O(n^3) ,在大规模问题中更为实用。

在最优化中的应用

不定矩阵在多变量微积分和最优化理论中具有核心地位。设 f:RnR f: \mathbb{R}^n \to \mathbb{R} 为二阶连续可微函数,f(x)=0 \nabla f(x^*) = 0 为驻点条件。则 x x^* 处的 Hessian 矩阵 Hf(x) H_f(x^*) 的类型决定了该点的性质:

  • Hf(x) H_f(x^*) 正定,则 x x^* 局部极小点
  • Hf(x) H_f(x^*) 负定,则 x x^* 局部极大点
  • Hf(x) H_f(x^*) 不定矩阵,则 x x^* 鞍点(Saddle Point)——函数沿某些方向上升,沿另一些方向下降。

这一结论来自二阶充分条件的泰勒展开分析:f(x+h)f(x)+12hTHf(x)h f(x^* + h) \approx f(x^*) + \frac{1}{2} h^{\mathsf{T}} H_f(x^*) h ,因此 Hessian 矩阵的符号特征直接决定了驻点附近函数值的变化趋势。

经济学中的鞍点与不定矩阵

在经济学中,鞍点(对应不定 Hessian 矩阵)频繁出现在动态优化和博弈论中。

动态最优化:在最优控制问题中,Hamiltonian 系统通常围绕鞍点稳定流形(saddle-path stable manifold)构建。例如 Ramsey-Cass-Koopmans 增长模型中的稳态均衡是鞍点:资本存量的特征根一正一负,经济沿稳定臂收敛至稳态。偏离稳定臂的任何扰动都会导致经济发散,因此不定矩阵的几何性质直接刻画了经济系统的稳定性边界。

博弈论:在二人零和博弈中,纳什均衡即为支付函数的鞍点。具体地,若参与人 1 选择策略 x x ,参与人 2 选择策略 y y ,支付函数 f(x,y) f(x, y) 在最优点处满足 f(x,y)f(x,y)f(x,y) f(x^*, y) \le f(x^*, y^*) \le f(x, y^*) ,这恰好对应 Hessian 矩阵(关于 x x y y )的不定性。

比较静态分析:当目标函数的 Hessian 矩阵不定时,比较静态结论不确定,参数的符号影响需要结合具体约束条件判断。这对于经济学中的政策分析具有重要启示:在鞍点附近,参数微调可能导致截然不同的均衡结果。

数值计算注意事项

不定矩阵在数值计算中需要特殊对待:

Cholesky 分解失效:不定矩阵不满足正定性,标准的 Cholesky 分解 A=LLT A = LL^{\mathsf{T}} 不可用。应使用 LDLT LDL^{\mathsf{T}} 分解(允许 D D 含负元)或 Bunch-Kaufman 分解。后者通过选取适当的枢轴(pivot)来保证数值稳定性。

迭代法选择:用于正定系统的经典共轭梯度法(CG)不适用于不定系统。针对对称不定线性系统 Ax=b Ax = b ,应使用 MINRES(最小残差法)或 SYMMLQ。MINRES 通过 Lanczos 三对角化过程构造 Krylov 子空间,在每一步最小化残差的 Euclidean 范数。

牛顿法修正:在无约束优化中,若 Hessian 矩阵不定,牛顿方向 d=H1f d = -H^{-1}\nabla f 可能不是下降方向。修正策略包括:(1)Hessian 矩阵正则化,即添加正对角矩阵 μI \mu I 使其正定;(2)使用拟牛顿法,如 BFGS,其更新公式天然保持正定性;(3)信赖域方法通过限制步长规避不定性带来的方向问题。

典型示例

  1. 矩阵 A=[1001] A = \begin{bmatrix} 1 & 0 \\ 0 & -1 \end{bmatrix} 是最简单的不定矩阵:特征值为 1 1 1 -1 。取 x=(1,0)T x = (1, 0)^{\mathsf{T}} xTAx=1>0 x^{\mathsf{T}} A x = 1 > 0 ;取 y=(0,1)T y = (0, 1)^{\mathsf{T}} yTAy=1<0 y^{\mathsf{T}} A y = -1 < 0
  1. 矩阵 B=[2332] B = \begin{bmatrix} 2 & 3 \\ 3 & 2 \end{bmatrix} 的特征值为 5 5 1 -1 ,故为不定矩阵。若将该矩阵视为某函数的 Hessian 矩阵,则对应驻点为鞍点。
  1. 函数 f(x,y)=x2y2 f(x, y) = x^2 - y^2 (0,0) (0, 0) 处的 Hessian 矩阵为 [2002] \begin{bmatrix} 2 & 0 \\ 0 & -2 \end{bmatrix} ,不定,故原点为鞍点。该函数在 x x 方向呈碗状向上,在 y y 方向呈碗状向下,直观展现了不定矩阵的几何含义。
  1. 考虑 3×3 3 \times 3 矩阵 C=diag(2,3,1) C = \text{diag}(2, -3, 1) ,特征值为 2,3,1 2, -3, 1 ,正负皆有,故为不定矩阵。这一例子说明不定矩阵的维度可以任意大,只要至少有一个正特征值和至少一个负特征值即可。

与其他矩阵类型的关系

所有对称矩阵按二次型的取值符号可划分为五类:正定(所有特征值 >0 >0 )、半正定(所有特征值 0 \ge 0 且至少一个为零)、负定(所有特征值 <0 <0 )、半负定(所有特征值 0 \le 0 且至少一个为零)、不定(特征值正负皆有)。不定矩阵是唯一一类使二次型符号不固定的矩阵。这一分类在多元微积分、优化理论、数值线性代数和计量经济学中均有广泛应用。理解不定矩阵的特征,对于正确识别最优化问题的解类型、选择合适的数值算法以及解释经济模型的动态性质,都至关重要。不定矩阵的理论贯穿了从基础线性代数到高级经济分析的各个层次,是连接数学工具与经济直觉的重要桥梁。

参考文献

  • Horn, R. A., \& Johnson, C. R. (2012). *Matrix Analysis*. Cambridge University Press.
  • Nocedal, J., \& Wright, S. J. (2006). *Numerical Optimization*. Springer.
  • Simon, C. P., \& Blume, L. (1994). *Mathematics for Economists*. W. W. Norton.