ARTICLE

对称正定矩阵

对称正定矩阵对称正定矩阵（Symmetric Positive Definite Matrix，简称 SPD 矩阵）是同时满足对称性与正定性的实方阵：设公式，若公式且对任意非零向量公式有公式，则称公式为对称正定矩阵。若仅满足公式，则退化为对称半正定矩阵。SPD 矩阵是矩阵分析中结构最优美、应用最广泛的矩阵族之一，在优化理论、统计学与

浏览 0 更新 2025-10-31

对称正定矩阵

对称正定矩阵（Symmetric Positive Definite Matrix，简称 SPD 矩阵）是同时满足对称性与正定性的实方阵：设 $A \in \mathbb{R}^{n \times n}$ ，若 $A^T = A$ 且对任意非零向量 $x \in \mathbb{R}^n \setminus \{0\}$ 有 $x^T A x > 0$ ，则称 $A$ 为对称正定矩阵。若仅满足 $x^T A x \geq 0$ ，则退化为对称半正定矩阵。SPD 矩阵是矩阵分析中结构最优美、应用最广泛的矩阵族之一，在优化理论、统计学与计量经济学中处于核心地位。

等价刻画

对称正定性拥有多个等价判定条件，实践中可视场景选用最便捷的判断方式：

特征值条件： $A$ 对称正定 $\iff$ $A$ 的所有特征值严格为正。这是最本质的刻画——对称性保证实特征值与正交对角化 $A = Q \Lambda Q^T$ ，其中 $\Lambda = \operatorname{diag}(\lambda_1, \dots, \lambda_n)$ ， $\lambda_i > 0$ 。由此可得 $A$ 的所有特征向量构成 $\mathbb{R}^n$ 的一组规范正交基。

Sylvester 准则： $A$ 对称正定 $\iff$ $A$ 的所有顺序主子式（leading principal minors）严格为正：

\det(A_{1:k,1:k}) > 0, \quad k = 1, 2, \dots, n

其中 $A_{1:k,1:k}$ 为取前 $k$ 行 $k$ 列的子矩阵。该准则无需计算特征值，特别适用于中小规模矩阵的手工判定。

Cholesky 分解： $A$ 对称正定 $\iff$ 存在唯一的主对角元为正的下三角矩阵 $L$ 使得 $A = L L^T$ 。Cholesky 分解是 SPD 矩阵的"签名性质"：它不仅是判定条件，更是数值计算的基础——求解 $Ax = b$ 时，先解 $Ly = b$ 再解 $L^T x = y$ ，计算量仅为 LU 分解的一半且数值稳定性极佳。

二次型与半范数： $A$ 对称正定 $\iff$ 映射 $x \mapsto \sqrt{x^T A x}$ 定义了 $\mathbb{R}^n$ 上的一个范数（Mahalanobis 距离是其典型实例）。该范数的单位球 $\{x : x^T A x = 1\}$ 是一个 $n$ 维椭球，其主轴方向由 $A$ 的特征向量确定，半轴长度等于 $1 / \sqrt{\lambda_i}$ 。

Gram 矩阵刻画： $A$ 对称正定 $\iff$ 存在满秩矩阵 $B \in \mathbb{R}^{m \times n}$ （ $m \geq n$ ）使得 $A = B^T B$ 。换言之，SPD 矩阵正是 $\mathbb{R}^n$ 中一组线性无关向量的 Gram 矩阵，其 $(i,j)$ 元为向量 $b_i$ 与 $b_j$ 的内积。

基本性质

逆的保持性：若 $A$ 对称正定，则 $A^{-1}$ 也是对称正定矩阵。这源于 $A^{-1}$ 的特征值为 $1/\lambda_i > 0$ 。
对角元非负性： $a_{ii} > 0$ 对所有 $i$ 成立。取 $x = e_i$ （标准基向量），则 $e_i^T A e_i = a_{ii} > 0$ 。更一般地， $\max_{i \neq j} |a_{ij}| \leq \max_i a_{ii}$ ——SPD 矩阵的最大元必出现在对角线上。
行列式与迹： $\det(A) = \prod_{i=1}^n \lambda_i > 0$ ， $\operatorname{tr}(A) = \sum_{i=1}^n \lambda_i > 0$ 。
凸锥结构：对称正定矩阵的集合是一个不包含原点的开凸锥：若 $A, B$ 为 SPD，则对任意 $\alpha, \beta > 0$ ， $\alpha A + \beta B$ 也是 SPD。
Loewner 偏序：在对称矩阵上定义偏序 $A \succ B \iff A - B$ 对称正定。该偏序在凸优化、矩阵分析中有广泛应用——例如 $A \succ B \succ 0$ 蕴涵 $B^{-1} \succ A^{-1}$ 。
平方根矩阵：存在唯一的 SPD 矩阵 $A^{1/2}$ 使得 $A^{1/2} A^{1/2} = A$ ，即 $A^{1/2} = Q \Lambda^{1/2} Q^T$ 。

经济学与计量经济学中的应用

协方差矩阵：多元统计分析中，任意非退化随机向量 $X \in \mathbb{R}^n$ 的协方差矩阵 $\Sigma = \mathbb{E}[(X-\mu)(X-\mu)^T]$ 是对称半正定的；若各分量不存在精确线性关系， $\Sigma$ 为对称正定。在多元线性回归中，误差协方差矩阵 $\mathbb{E}[\varepsilon \varepsilon^T] = \sigma^2 I$ 为 SPD 的特殊情况；广义最小二乘法（GLS）中 $\mathbb{E}[\varepsilon \varepsilon^T] = \Omega$ （SPD）用于处理异方差与自相关。

Hessian 矩阵与凸优化：严格凸函数 $f: \mathbb{R}^n \to \mathbb{R}$ 的 Hessian 矩阵 $\nabla^2 f(x)$ 在所有点处对称正定。SPD Hessian 保证一阶条件 $\nabla f(x^*) = 0$ 的解是唯一的全局极小值点——这构成了极大似然估计的渐近理论与牛顿法收敛性分析的基石。在计量经济学的极值估计（extremum estimation）框架中，目标函数 $Q_n(\theta)$ 在真值 $\theta_0$ 附近 Hessian 的正定性是参数识别的关键条件。

最优投资组合：Markowitz 均值-方差模型中， $n$ 种风险资产的协方差矩阵 $\Sigma$ 是 SPD。最小方差投资组合问题：

\min_{w} \; w^T \Sigma w \quad \text{s.t.} \quad w^T \mathbf{1} = 1

有唯一解析解 $w^* = \Sigma^{-1} \mathbf{1} / (\mathbf{1}^T \Sigma^{-1} \mathbf{1})$ ，该表达式依赖 $\Sigma$ 的正定性。若 $\Sigma$ 病态（最大与最小特征值之比过大），小估计误差可导致权重剧烈波动——这是实践中引入Lasso或岭回归正则化的重要原因。

Slutsky 矩阵：需求理论中，Slutsky 方程的替代矩阵为对称半负定矩阵，其负矩阵（即替代项的负值）为对称正定。Hicks 替代效应的负定性等价于显示偏好公理的一致性，是消费者理论中可检验的核心推论。

Karlin 等价特征：在投入产出分析中，Leontief 逆矩阵 $(I - A)^{-1}$ 的 SPD 性质保证了生产系统的可行性。在数值计算中，大规模稀疏 SPD 系统的求解可借助共轭梯度法，仅需矩阵-向量乘法而无需显式存储逆矩阵。

对称正定矩阵