对称正定矩阵
对称正定矩阵 (Symmetric Positive Definite Matrix,简称 SPD 矩阵)是同时满足对称性与正定性的实方阵:设 A ∈ R n × n A \in \mathbb{R}^{n \times n} A ∈ R n × n ,若 A T = A A^T = A A T = A 且对任意非零向量 x ∈ R n ∖ { 0 } x \in \mathbb{R}^n \setminus \{0\} x ∈ R n ∖ { 0 } 有 x T A x > 0 x^T A x > 0 x T A x > 0 ,则称 A A A 为对称正定矩阵。若仅满足 x T A x ≥ 0 x^T A x \geq 0 x T A x ≥ 0 ,则退化为对称半正定矩阵 。SPD 矩阵是矩阵分析中结构最优美、应用最广泛的矩阵族之一,在优化理论、统计学与计量经济学中处于核心地位。
等价刻画
对称正定性拥有多个等价判定条件,实践中可视场景选用最便捷的判断方式:
特征值条件 :A A A 对称正定 ⟺ \iff ⟺ A A A 的所有特征值严格为正。这是最本质的刻画——对称性保证实特征值与正交对角化 A = Q Λ Q T A = Q \Lambda Q^T A = Q Λ Q T ,其中 Λ = diag ( λ 1 , … , λ n ) \Lambda = \operatorname{diag}(\lambda_1, \dots, \lambda_n) Λ = diag ( λ 1 , … , λ n ) ,λ i > 0 \lambda_i > 0 λ i > 0 。由此可得 A A A 的所有特征向量构成 R n \mathbb{R}^n R n 的一组规范正交基。
Sylvester 准则 :A A A 对称正定 ⟺ \iff ⟺ A A A 的所有顺序主子式(leading principal minors)严格为正:
det ( A 1 : k , 1 : k ) > 0 , k = 1 , 2 , … , n \det(A_{1:k,1:k}) > 0, \quad k = 1, 2, \dots, n det ( A 1 : k , 1 : k ) > 0 , k = 1 , 2 , … , n
其中 A 1 : k , 1 : k A_{1:k,1:k} A 1 : k , 1 : k 为取前 k k k 行 k k k 列的子矩阵。该准则无需计算特征值,特别适用于中小规模矩阵的手工判定。
Cholesky 分解 :A A A 对称正定 ⟺ \iff ⟺ 存在唯一的主对角元为正的下三角矩阵 L L L 使得 A = L L T A = L L^T A = L L T 。Cholesky 分解是 SPD 矩阵的"签名性质":它不仅是判定条件,更是数值计算的基础——求解 A x = b Ax = b A x = b 时,先解 L y = b Ly = b L y = b 再解 L T x = y L^T x = y L T x = y ,计算量仅为 LU 分解的一半且数值稳定性极佳。
二次型与半范数 :A A A 对称正定 ⟺ \iff ⟺ 映射 x ↦ x T A x x \mapsto \sqrt{x^T A x} x ↦ x T A x 定义了 R n \mathbb{R}^n R n 上的一个范数 (Mahalanobis 距离是其典型实例)。该范数的单位球 { x : x T A x = 1 } \{x : x^T A x = 1\} { x : x T A x = 1 } 是一个 n n n 维椭球,其主轴方向由 A A A 的特征向量确定,半轴长度等于 1 / λ i 1 / \sqrt{\lambda_i} 1/ λ i 。
Gram 矩阵刻画 :A A A 对称正定 ⟺ \iff ⟺ 存在满秩矩阵 B ∈ R m × n B \in \mathbb{R}^{m \times n} B ∈ R m × n (m ≥ n m \geq n m ≥ n )使得 A = B T B A = B^T B A = B T B 。换言之,SPD 矩阵正是 R n \mathbb{R}^n R n 中一组线性无关向量的 Gram 矩阵,其 ( i , j ) (i,j) ( i , j ) 元为向量 b i b_i b i 与 b j b_j b j 的内积。
基本性质
逆的保持性 :若 A A A 对称正定,则 A − 1 A^{-1} A − 1 也是对称正定矩阵。这源于 A − 1 A^{-1} A − 1 的特征值为 1 / λ i > 0 1/\lambda_i > 0 1/ λ i > 0 。对角元非负性 :a i i > 0 a_{ii} > 0 a ii > 0 对所有 i i i 成立。取 x = e i x = e_i x = e i (标准基向量),则 e i T A e i = a i i > 0 e_i^T A e_i = a_{ii} > 0 e i T A e i = a ii > 0 。更一般地,max i ≠ j ∣ a i j ∣ ≤ max i a i i \max_{i \neq j} |a_{ij}| \leq \max_i a_{ii} max i = j ∣ a ij ∣ ≤ max i a ii ——SPD 矩阵的最大元必出现在对角线上。行列式与迹 :det ( A ) = ∏ i = 1 n λ i > 0 \det(A) = \prod_{i=1}^n \lambda_i > 0 det ( A ) = ∏ i = 1 n λ i > 0 ,tr ( A ) = ∑ i = 1 n λ i > 0 \operatorname{tr}(A) = \sum_{i=1}^n \lambda_i > 0 tr ( A ) = ∑ i = 1 n λ i > 0 。凸锥结构 :对称正定矩阵的集合是一个不包含原点的开凸锥:若 A , B A, B A , B 为 SPD,则对任意 α , β > 0 \alpha, \beta > 0 α , β > 0 ,α A + β B \alpha A + \beta B α A + βB 也是 SPD。Loewner 偏序 :在对称矩阵上定义偏序 A ≻ B ⟺ A − B A \succ B \iff A - B A ≻ B ⟺ A − B 对称正定。该偏序在凸优化、矩阵分析中有广泛应用——例如 A ≻ B ≻ 0 A \succ B \succ 0 A ≻ B ≻ 0 蕴涵 B − 1 ≻ A − 1 B^{-1} \succ A^{-1} B − 1 ≻ A − 1 。平方根矩阵 :存在唯一的 SPD 矩阵 A 1 / 2 A^{1/2} A 1/2 使得 A 1 / 2 A 1 / 2 = A A^{1/2} A^{1/2} = A A 1/2 A 1/2 = A ,即 A 1 / 2 = Q Λ 1 / 2 Q T A^{1/2} = Q \Lambda^{1/2} Q^T A 1/2 = Q Λ 1/2 Q T 。
经济学与计量经济学中的应用
协方差矩阵 :多元统计分析中,任意非退化随机向量 X ∈ R n X \in \mathbb{R}^n X ∈ R n 的协方差矩阵 Σ = E [ ( X − μ ) ( X − μ ) T ] \Sigma = \mathbb{E}[(X-\mu)(X-\mu)^T] Σ = E [( X − μ ) ( X − μ ) T ] 是对称半正定的;若各分量不存在精确线性关系,Σ \Sigma Σ 为对称正定。在多元线性回归 中,误差协方差矩阵 E [ ε ε T ] = σ 2 I \mathbb{E}[\varepsilon \varepsilon^T] = \sigma^2 I E [ ε ε T ] = σ 2 I 为 SPD 的特殊情况;广义最小二乘法 (GLS)中 E [ ε ε T ] = Ω \mathbb{E}[\varepsilon \varepsilon^T] = \Omega E [ ε ε T ] = Ω (SPD)用于处理异方差与自相关。
Hessian 矩阵与凸优化 :严格凸函数 f : R n → R f: \mathbb{R}^n \to \mathbb{R} f : R n → R 的 Hessian 矩阵 ∇ 2 f ( x ) \nabla^2 f(x) ∇ 2 f ( x ) 在所有点处对称正定。SPD Hessian 保证一阶条件 ∇ f ( x ∗ ) = 0 \nabla f(x^*) = 0 ∇ f ( x ∗ ) = 0 的解是唯一的全局极小值点——这构成了极大似然估计 的渐近理论与牛顿法 收敛性分析的基石。在计量经济学的极值估计 (extremum estimation)框架中,目标函数 Q n ( θ ) Q_n(\theta) Q n ( θ ) 在真值 θ 0 \theta_0 θ 0 附近 Hessian 的正定性是参数识别的关键条件。
最优投资组合 :Markowitz 均值-方差模型 中,n n n 种风险资产的协方差矩阵 Σ \Sigma Σ 是 SPD。最小方差投资组合问题:
min w w T Σ w s.t. w T 1 = 1 \min_{w} \; w^T \Sigma w \quad \text{s.t.} \quad w^T \mathbf{1} = 1 w min w T Σ w s.t. w T 1 = 1
有唯一解析解 w ∗ = Σ − 1 1 / ( 1 T Σ − 1 1 ) w^* = \Sigma^{-1} \mathbf{1} / (\mathbf{1}^T \Sigma^{-1} \mathbf{1}) w ∗ = Σ − 1 1 / ( 1 T Σ − 1 1 ) ,该表达式依赖 Σ \Sigma Σ 的正定性。若 Σ \Sigma Σ 病态(最大与最小特征值之比过大),小估计误差可导致权重剧烈波动——这是实践中引入Lasso 或岭回归 正则化的重要原因。
Slutsky 矩阵 :需求理论中,Slutsky 方程 的替代矩阵为对称半负定矩阵,其负矩阵(即替代项的负值)为对称正定。Hicks 替代效应的负定性等价于显示偏好 公理的一致性,是消费者理论中可检验的核心推论。
Karlin 等价特征 :在投入产出分析 中,Leontief 逆矩阵 ( I − A ) − 1 (I - A)^{-1} ( I − A ) − 1 的 SPD 性质保证了生产系统的可行性。在数值计算中,大规模稀疏 SPD 系统的求解可借助共轭梯度法 ,仅需矩阵-向量乘法而无需显式存储逆矩阵。
相关概念与扩展
对称正定矩阵的泛化包括正定算子 (在 Hilbert 空间上,要求 ⟨ A x , x ⟩ > 0 \langle Ax, x \rangle > 0 ⟨ A x , x ⟩ > 0 对所有 x ≠ 0 x \neq 0 x = 0 成立)与正定核 (用于支持向量机 与高斯过程 的 Mercer 核 K ( x , y ) K(x, y) K ( x , y ) 对应无限维 SPD 矩阵)。统计学习中,核岭回归 、高斯过程回归 等方法的核心假设即 Gram 矩阵为正定,这保证了预测方差的非负性和模型计算的稳定性。
口诀 :对称正定四等价——特征全正、主子式正、Cholesky 可分解、二次型恒正。协方差、Hessian、Slutsky——三块基石皆正定。
关于知经 KNOWECON
知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌,长期面向北京大学、清华大学、中国人民大学等顶尖院校,提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考,并成功进入理想院校。
知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业,获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者,长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。
我们相信,好的考研辅导不只是押题和陪跑,更是把复杂知识讲清楚、把复习路径设计清楚,并用技术让学习过程更可追踪、更可反馈、更可坚持。