ARTICLE

正定性

正定性 (Positive Definiteness) 正定性是线性代数与矩阵分析中的核心概念,描述一个二次型对所有非零向量均取正值这一性质。正定矩阵在最优化、计量经济学、统计学、数值分析及经济学中扮演着基础性角色——从Hessian矩阵判定极值条件,到协方差矩阵的构造,再到博弈论中的拟线性偏好表示,处处可见正定性的身影。 定义与基本性质 一个 n n 实对

浏览 4 更新 2025-12-20

正定性 (Positive Definiteness)

正定性线性代数矩阵分析中的核心概念,描述一个二次型对所有非零向量均取正值这一性质。正定矩阵在最优化计量经济学统计学数值分析经济学中扮演着基础性角色——从Hessian矩阵判定极值条件,到协方差矩阵的构造,再到博弈论中的拟线性偏好表示,处处可见正定性的身影。

定义与基本性质

一个 n×n n \times n 实对称矩阵 A A 称为正定矩阵,若对所有非零向量 xRn x \in \mathbb{R}^n ,有:

xAx>0x^\top A x > 0

若仅满足 xAx0 x^\top A x \geq 0 ,则称 A A 半正定矩阵。类似地可定义负定与半负定矩阵。对称性是上述定义的前提——非对称矩阵的二次型等价于其对称化部分的二次型,因此正定性讨论通常限于对称矩阵。

正定矩阵具有以下重要性质:

  • 所有特征值均为正实数;
  • 所有主子式均为正(Sylvester判据);
  • 可逆,且逆矩阵亦正定;
  • 存在唯一的Cholesky分解 A=LL A = LL^\top ,其中 L L 为下三角矩阵;
  • 对角线元素均为正:aii>0 a_{ii} > 0

判定方法:Sylvester判据

Sylvester判据是判定实对称矩阵正定性的充要条件:矩阵 A A 正定当且仅当所有顺序主子式(leading principal minors)为正。即:

det(A1:k)>0,k=1,2,,n\det(A_{1:k}) > 0, \quad k = 1, 2, \dots, n

其中 A1:k A_{1:k} 表示 A A 左上角的 k×k k \times k 子矩阵。例如,对一个 2×2 2 \times 2 对称矩阵 A=(abbc) A = \begin{pmatrix} a & b \\ b & c \end{pmatrix} ,正定的充要条件为 a>0 a > 0 det(A)=acb2>0 \det(A) = ac - b^2 > 0

经济学与统计学中的应用

Hessian矩阵与极值判定

最优化理论中,对一个二阶连续可微函数 f:RnR f: \mathbb{R}^n \to \mathbb{R} ,其Hessian矩阵 H(x)=[2f/xixj] H(x) = [\partial^2 f / \partial x_i \partial x_j] 临界点处的正定性决定了该点的局部性质:

  • H(x) H(x^*) 正定 \Rightarrow x x^* 局部极小值点;
  • H(x) H(x^*) 负定 \Rightarrow x x^* 局部极大值点;
  • H(x) H(x^*) 不定 \Rightarrow x x^* 鞍点

微观经济学中,利润函数支出函数的Hessian矩阵的正定性对应着供给法则补偿需求法则的微观基础,是对偶理论的重要工具。

协方差矩阵

多元统计分析中,随机向量 X=(X1,,Xn) X = (X_1, \dots, X_n)^\top 协方差矩阵 Σ=Cov(X) \Sigma = \operatorname{Cov}(X) 必为半正定矩阵。这是因为对任意向量 a a

aΣa=Var(aX)0a^\top \Sigma a = \operatorname{Var}(a^\top X) \geq 0

协方差矩阵的正定性意味着所有分量之间不存在线性依赖关系(即无多重共线性),这是最小二乘法中设计矩阵列满秩条件的等价表述。

加边Hessian矩阵与约束优化

约束优化问题中,拉格朗日函数的Hessian矩阵在约束子空间上的正定性给出了约束极值的二阶充分条件。加边海塞矩阵(bordered Hessian)的顺序主子式符号规则与无约束情形不同,需从第 2m+1 2m+1 阶主子式开始考察符号交替(m m 为约束个数)。

Cholesky分解与数值计算

正定矩阵在数值计算中的一个关键优势在于其Cholesky分解的稳定性与高效性。对正定矩阵 A A ,存在唯一的下三角矩阵 L L 使得 A=LL A = LL^\top 。Cholesky分解的计算复杂度为 O(n3/3) \mathcal{O}(n^3/3) ,约为标准LU分解的一半,且无需选主元(pivot),在数值稳定性上表现优异。

这一分解在计量经济学中用于生成多元正态随机数:若 Z Z 为独立标准正态向量,则 X=μ+LZ X = \mu + LZ 服从 N(μ,Σ) N(\mu, \Sigma) 。在卡尔曼滤波高斯过程中,Cholesky分解也是核心计算工具。

正定性与凸性

一个二次可微函数凸函数的充要条件是其Hessian矩阵在整个定义域上半正定。严格凸对应Hessian正定。这一联系将凸优化理论与矩阵正定性紧密耦合——线性回归的目标函数因设计矩阵 XX X^\top X 的半正定性而天然为凸,保证全局最优解的存在性与唯一性。

> 核心直觉:正定性是"朝上弯曲"的代数表征——无论沿哪个方向切割,函数或曲面的曲率都为正,这正是局部极小值与凸性的数学根源。