ARTICLE
正定
正定 (Positive Definiteness) 正定是线性代数中关于矩阵和二次型的核心性质。一个实对称矩阵被称为正定矩阵 (Positive Definite Matrix),当且仅当它所对应的二次型对于任意非零向量都取正值。正定性在最优化理论、计量经济学和统计学习中扮演着关键角色:它保证了目标函数的凸性、协方差矩阵的有效性以及最优化问题二阶条件的成立
正定 (Positive Definiteness)
正定是线性代数中关于矩阵和二次型的核心性质。一个实对称矩阵被称为正定矩阵 (Positive Definite Matrix),当且仅当它所对应的二次型对于任意非零向量都取正值。正定性在最优化理论、计量经济学和统计学习中扮演着关键角色:它保证了目标函数的凸性、协方差矩阵的有效性以及最优化问题二阶条件的成立。
定义
设 为 实对称矩阵, 为非零列向量。 是正定矩阵当且仅当:
若将严格大于号换为大于等于号 (),则 称为半正定矩阵 (Positive Semidefinite)。对称性通常是隐含条件——非对称矩阵可以通过 转化为对称形式,因为只有对称部分影响二次型的值:
判别方法
正定性的判别有多个等价条件。对于实对称矩阵 ,以下命题等价:
- 是正定矩阵。
- 的所有特征值均为正数:。
- 的所有顺序主子式 (Leading Principal Minors) 均大于零,即对 ,有 ,其中 是 的前 行 列构成的子矩阵。此即西尔维斯特准则 (Sylvester's Criterion)。
- 存在列满秩矩阵 使得 ,等价于 可以进行楚列斯基分解 ,其中 为对角元全正的下三角矩阵。
- 的主元 (Pivots,经高斯消元后对角元) 全为正数。
例如,矩阵
其特征值为 ,顺序主子式 ,,故为正定。
几何意义
正定二次型 () 在 中定义了一个椭球。矩阵 的特征向量决定了椭球的主轴方向,特征值的倒数平方根决定了各主轴的长度。这一几何解释在马氏距离 (Mahalanobis Distance) 和高斯分布的等概率密度面上有直接应用:多元正态分布 的概率密度函数中,二次型 定义了以 为中心的椭球等值面,而协方差矩阵 必须正定以保证密度函数处处有定义且整体积分为 1。
经济学与统计学中的应用
最优化中的二阶条件。在无约束最优化问题 中,设梯度 。若海塞矩阵 是正定矩阵,则 为严格的局部极小点;若半正定,则为必要二阶条件。在凸优化中,目标函数 是凸函数的充要条件是其海塞矩阵处处半正定。
计量经济学中的协方差矩阵。在广义最小二乘法 (GLS) 和广义矩估计 (GMM) 中,权重矩阵 必须为正定矩阵以确保估计量具有良好的统计性质。若误差项的协方差矩阵 不是正定的,则模型设定存在根本问题(如线性相关的扰动项)。
投入产出分析。里昂惕夫逆矩阵 的存在性和非负性依赖于技术系数矩阵 满足霍金斯-西蒙条件 (Hawkins-Simon Condition),该条件等价于 的各顺序主子式为正——正是正定性的西尔维斯特条件的变形。
资产定价与投资组合。在均值-方差优化中, 个风险资产的协方差矩阵 必须正定。若存在冗余资产(可由其他资产线性组合完全复制),则 仅为半正定、不可逆,无法唯一求解最优权重 。
相关概念辨析
- 负定矩阵: 对所有 成立,等价于 正定。在经济优化中对应目标函数的严格凹性和极大点的二阶充分条件。
- 不定矩阵:二次型取值有正有负。在海塞矩阵的语境下对应鞍点。
- 对角占优:若对称矩阵每个对角元的绝对值大于其所在行非对角元绝对值之和,且所有对角元为正,则该矩阵正定。这是西尔维斯特准则以外的一种实用判定方法。
正定矩阵将线性代数中"正数"的概念推广到了矩阵空间。从数值算法的楚列斯基分解到计量经济学的协方差建模,再到机器学习中的核方法(核矩阵必须半正定),正定性构成了定量社会科学中不可或缺的数学基石。