ARTICLE
不定矩阵
不定矩阵(Indefinite Matrix)是指对称(或 Hermite)矩阵 A 满足:其对应的二次型 x^ T A x 既可以为正也可以为负,具体取值取决于非零向量 x 的选择。等价地, A 的特征值中既有正值也有负值。不定矩阵是除正定、半正定、负定、半负定之外的第五种也是最后一种对称矩阵类型。 定义 设 A R^n n 为对称矩阵。若存在向量 x,
不定矩阵(Indefinite Matrix)是指对称(或 Hermite)矩阵 满足:其对应的二次型 既可以为正也可以为负,具体取值取决于非零向量 的选择。等价地, 的特征值中既有正值也有负值。不定矩阵是除正定、半正定、负定、半负定之外的第五种也是最后一种对称矩阵类型。
定义
设 为对称矩阵。若存在向量 使得
则称 为不定矩阵。这等价于 的特征值集合 同时包含正数和负数。如果矩阵不是对称的,通常先考虑其对称部分 来判断二次型的符号特征。
对于 Hermite 矩阵(复对称矩阵),定义类似:若存在非零复向量 使得 且 ,则 为不定矩阵。
判定方法
除直接计算特征值符号外,还有以下实用判据:
顺序主子式法:对于对称矩阵 ,若存在奇数阶顺序主子式为负,且偶数阶顺序主子式为正(即不满足正定或负定的符号模式),则 可能为不定矩阵。但此方法仅适用于对称矩阵,且要求所有顺序主子式非零。当主子式为零时,需要借助更精细的分析。
Sylvester惯性定律:矩阵的惯性指数(正特征值个数 、负特征值个数 、零特征值个数 )在合同变换下保持不变。因此通过合同对角化 后,若 既含有正元也含有负元,即可判定 为不定矩阵。
LDL^T 分解:若 的对角阵 同时含有正元和负元,则 为不定矩阵。这一分解避免了显式计算特征值,计算复杂度为 ,在大规模问题中更为实用。
在最优化中的应用
不定矩阵在多变量微积分和最优化理论中具有核心地位。设 为二阶连续可微函数, 为驻点条件。则 处的 Hessian 矩阵 的类型决定了该点的性质:
- 若 正定,则 为局部极小点。
- 若 负定,则 为局部极大点。
- 若 为不定矩阵,则 为鞍点(Saddle Point)——函数沿某些方向上升,沿另一些方向下降。
这一结论来自二阶充分条件的泰勒展开分析:,因此 Hessian 矩阵的符号特征直接决定了驻点附近函数值的变化趋势。
经济学中的鞍点与不定矩阵
在经济学中,鞍点(对应不定 Hessian 矩阵)频繁出现在动态优化和博弈论中。
动态最优化:在最优控制问题中,Hamiltonian 系统通常围绕鞍点稳定流形(saddle-path stable manifold)构建。例如 Ramsey-Cass-Koopmans 增长模型中的稳态均衡是鞍点:资本存量的特征根一正一负,经济沿稳定臂收敛至稳态。偏离稳定臂的任何扰动都会导致经济发散,因此不定矩阵的几何性质直接刻画了经济系统的稳定性边界。
博弈论:在二人零和博弈中,纳什均衡即为支付函数的鞍点。具体地,若参与人 1 选择策略 ,参与人 2 选择策略 ,支付函数 在最优点处满足 ,这恰好对应 Hessian 矩阵(关于 和 )的不定性。
比较静态分析:当目标函数的 Hessian 矩阵不定时,比较静态结论不确定,参数的符号影响需要结合具体约束条件判断。这对于经济学中的政策分析具有重要启示:在鞍点附近,参数微调可能导致截然不同的均衡结果。
数值计算注意事项
不定矩阵在数值计算中需要特殊对待:
Cholesky 分解失效:不定矩阵不满足正定性,标准的 Cholesky 分解 不可用。应使用 分解(允许 含负元)或 Bunch-Kaufman 分解。后者通过选取适当的枢轴(pivot)来保证数值稳定性。
迭代法选择:用于正定系统的经典共轭梯度法(CG)不适用于不定系统。针对对称不定线性系统 ,应使用 MINRES(最小残差法)或 SYMMLQ。MINRES 通过 Lanczos 三对角化过程构造 Krylov 子空间,在每一步最小化残差的 Euclidean 范数。
牛顿法修正:在无约束优化中,若 Hessian 矩阵不定,牛顿方向 可能不是下降方向。修正策略包括:(1)Hessian 矩阵正则化,即添加正对角矩阵 使其正定;(2)使用拟牛顿法,如 BFGS,其更新公式天然保持正定性;(3)信赖域方法通过限制步长规避不定性带来的方向问题。
典型示例
- 矩阵 是最简单的不定矩阵:特征值为 和 。取 得 ;取 得 。
- 矩阵 的特征值为 和 ,故为不定矩阵。若将该矩阵视为某函数的 Hessian 矩阵,则对应驻点为鞍点。
- 函数 在 处的 Hessian 矩阵为 ,不定,故原点为鞍点。该函数在 方向呈碗状向上,在 方向呈碗状向下,直观展现了不定矩阵的几何含义。
- 考虑 矩阵 ,特征值为 ,正负皆有,故为不定矩阵。这一例子说明不定矩阵的维度可以任意大,只要至少有一个正特征值和至少一个负特征值即可。
与其他矩阵类型的关系
所有对称矩阵按二次型的取值符号可划分为五类:正定(所有特征值 )、半正定(所有特征值 且至少一个为零)、负定(所有特征值 )、半负定(所有特征值 且至少一个为零)、不定(特征值正负皆有)。不定矩阵是唯一一类使二次型符号不固定的矩阵。这一分类在多元微积分、优化理论、数值线性代数和计量经济学中均有广泛应用。理解不定矩阵的特征,对于正确识别最优化问题的解类型、选择合适的数值算法以及解释经济模型的动态性质,都至关重要。不定矩阵的理论贯穿了从基础线性代数到高级经济分析的各个层次,是连接数学工具与经济直觉的重要桥梁。
参考文献
- Horn, R. A., \& Johnson, C. R. (2012). *Matrix Analysis*. Cambridge University Press.
- Nocedal, J., \& Wright, S. J. (2006). *Numerical Optimization*. Springer.
- Simon, C. P., \& Blume, L. (1994). *Mathematics for Economists*. W. W. Norton.