ARTICLE

正定或半正定

正定或半正定 (Positive Definite / Positive Semidefinite) 正定与半正定→线性代数/矩阵分析核心概念→刻画实对称矩阵(或更一般Hermitian矩阵)的"正性"程度→通过二次型符号性质定义→在最优化、计量经济学、宏观经济学动态系统中有广泛应用。核心定义→n n实对称矩阵A:若对所有非零x R^n有x'Ax>0→A正定

浏览 0 更新 2025-12-09

正定或半正定 (Positive Definite / Positive Semidefinite)

正定半正定线性代数/矩阵分析核心概念→刻画实对称矩阵(或更一般Hermitian矩阵)的"正性"程度→通过二次型符号性质定义→在最优化计量经济学宏观经济学动态系统中有广泛应用。核心定义→n×nn\times n实对称矩阵AA:若对所有非零xRnx\in\mathbb{R}^nxAx>0x'Ax>0AA正定;若xAx0x'Ax\ge0AA半正定(正半定)。经济学核心意义→海森矩阵正定    \iff函数严格凸→二阶条件基础;方差-协方差矩阵必半正定→统计推断基石。

定义与二次型刻画

正定矩阵 (Positive Definite, PD):实对称矩阵An×nA_{n\times n}满足→xRn,x0\forall x\in\mathbb{R}^n,x\neq0→二次型xAx=i=1nj=1naijxixj>0x'Ax=\sum_{i=1}^n\sum_{j=1}^n a_{ij}x_ix_j>0→等价A0A\succ0(Loewner偏序记号)。

半正定矩阵 (Positive Semidefinite, PSD):条件弱化→xRn\forall x\in\mathbb{R}^nxAx0x'Ax\ge0→等价A0A\succeq0→存在非零xx使xAx=0x'Ax=0为"半"之关键→对应零特征值。

负定与半负定AA负定    A\iff -A正定;AA半负定    A\iff -A半正定。不定矩阵:既有正又有负的二次型取值→xAxx'Ax可正可负→最优化中对应鞍点。

非对称矩阵推广:对非对称AA→二次型xAxx'Ax仅依赖对称部分A+A2\frac{A+A'}{2}→通常仅对对称矩阵讨论正定性→经济应用中几乎全为对称矩阵(Hessian、协方差阵均对称)。

特征值刻画

正定性可与特征值建立充要联系→最常用判定方式之一:

  • PD    \iff所有特征值严格为正A0    λi(A)>0,i=1,,nA\succ0\iff\lambda_i(A)>0,\forall i=1,\ldots,n→谱分解A=QΛQA=Q\Lambda Q'Λ\Lambda对角元全正。
  • PSD    \iff所有特征值非负A0    λi(A)0,iA\succeq0\iff\lambda_i(A)\ge0,\forall i→至少一个零特征值即非PD。
  • 负定    \iff所有特征值严格为负λi<0,i\lambda_i<0,\forall i
  • 不定    \iff既有正又有负特征值

经济学直觉海森矩阵特征值全正→局部极小点(严格凸);全负→局部极大点(严格凹);正负混合→鞍点。计量中信息矩阵特征值→各参数方向信息量→全正则参数可识别。

主子式与Sylvester判据

Sylvester判据(正定性最实用充要条件)→实对称矩阵AA正定    \iff所有顺序主子式(leading principal minors)为正。顺序主子式:取前kkkk列构成子阵的行列式→Ak>0, k=1,,n|A_k|>0,\ k=1,\ldots,n

实例→A=(ab\bc)A=\begin{pmatrix}a&b\b&c\end{pmatrix}正定    a>0\iff a>0acb2>0ac-b^2>0→后者即行列式为正→几何含义:矩阵"面积伸缩因子"为正。

PSD的注意:所有顺序主子式非负并非PSD的充要条件→仅当所有主子式(不限于顺序)非负才等价→因顺序主子式非负矩阵可能不定。实际判定PSD更常用特征值法或Cholesky尝试分解。

Cholesky分解与构造性判定

Cholesky分解AA正定    \iff存在唯一的下三角矩阵LL(对角元为正)使A=LLA=LL'→该分解提供构造性判定→尝试计算Cholesky→若过程中对角元恒正则PD→若出现零则PSD→若出现负则不定。

经济学应用蒙特卡洛模拟中生成相关随机向量→给定协方差阵Σ\Sigma(PSD)→Cholesky分解Σ=LL\Sigma=LL'→若zN(0,I)z\sim N(0,I)LzN(0,Σ)Lz\sim N(0,\Sigma)。计量中GLS估计→Ω1=PP\Omega^{-1}=P'P变换→等价Cholesky思路。

经济学核心应用

(一)最优化与二阶条件

目标函数f:RnRf:\mathbb{R}^n\to\mathbb{R}海森矩阵Hf=2f(x)H_f=\nabla^2 f(x^*)

  • Hf(x)H_f(x^*)正定\Rightarrow严格局部极小→无约束最优化的充分条件。
  • Hf(x)H_f(x^*)负定\Rightarrow严格局部极大
  • Hf(x)H_f(x^*)不定\Rightarrow鞍点→一阶条件满足但非极值。
  • Hf(x)H_f(x^*)半正定\Rightarrow需更高阶信息→可能极小也可能拐点。

凸性联系ff    Hf(x)0,x\iff H_f(x)\succeq0,\forall x(全局)→ff严格凸Hf(x)0,x\Leftarrow H_f(x)\succ0,\forall x(充分非必要)→正定性在此成为凸优化的理论支点。

约束优化Kuhn-Tucker条件中→加边海森矩阵(bordered Hessian)的正定性条件判定约束极值→比较静态分析中常用。

(二)计量经济学与统计

方差-协方差矩阵:任意随机向量XX的协方差阵Σ=Var(X)\Sigma=\mathrm{Var}(X)必半正定→因Var(cX)=cΣc0\mathrm{Var}(c'X)=c'\Sigma c\ge0→方差非负直接推得PSD→若Σ\Sigma正定则随机向量不存在线性依赖→"满秩"→多元正态密度存在。

广义最小二乘法(GLS)Ω=Var(ε)\Omega=\mathrm{Var}(\varepsilon)需正定→GLS估计量β^=(XΩ1X)1XΩ1y\hat\beta=(X'\Omega^{-1}X)^{-1}X'\Omega^{-1}y才有定义→可行GLS需估计Ω^\hat\Omega并保证其正定性。

HAC/Newey-West:异方差自相关一致协方差估计量→构造中需确保所得协方差阵半正定→经典的White估计量天然PSD→某些小样本修正可能破坏PSD性→实证中需留意。

(三)宏观经济学与动态系统

线性差分方程系统xt=Axt1x_t=Ax_{t-1}→稳定性条件→AA的所有特征值模长小于1→若AA可化为对称正定矩阵→稳定与特征值全正等价→Lyapunov方程APAP=QA'PA-P=-QP,QP,Q正定\Rightarrow全局渐近稳定。

DSGE模型Blanchard-Kahn条件中→线性理性预期模型的鞍点路径稳定性需系数矩阵特征值分解→正定性为判定唯一稳定解的条件之一。

投入产出分析Leontief逆矩阵(IA)1(I-A)^{-1}的正定性确保经济系统生产性→Hawkins-Simon条件:所有顺序主子式为正    \iff技术矩阵AA具有生产性→古典结论→本质即正定性判据。

(四)金融经济学

均值-方差分析:协方差矩阵Σ\Sigma正定→马科维茨有效前沿存在唯一最小方差组合→若仅PSD(奇异)则存在冗余资产→某些资产完全由其余资产线性表示→协方差奇异则最小方差组合权重不唯一→两基金分离定理框架下需Σ\Sigma满秩。

CAPM推导中→市场组合方差σM2\sigma_M^2为正→等价回报协方差阵正定→若存在无风险资产→切点组合有定义→正定性是核心假设。

判定流程图与实用技巧

快速判定路径(对称矩阵AA):

  • ①检查对角元:若存在aii0a_{ii}\le0→非PD(因基向量eie_i的二次型eiAei=aiie_i'Ae_i=a_{ii})→必要条件。
  • ②若2×22\times2a11>0a_{11}>0det(A)>0\det(A)>0→PD。
  • ③若3×33\times3及以上→Sylvester判据(顺序主子式全正)→最直接。
  • ④或计算特征值(数值方法)→全正即PD。
  • ⑤半定性→特征值全非负→或尝试Cholesky→看是否出现零/负对角元。

常见陷阱:顺序主子式非负不足以保证PSD→反例→(0001)\begin{pmatrix}0&0\\0&-1\end{pmatrix}顺序主子式0,00,0但非PSD(x=(0,1)x=(0,1)时二次型=1=-1)→需所有主子式非负→实践中用特征值法或Cholesky最稳妥。

相关概念与延伸

对角占优→充分条件:对称矩阵若严格对角占优且对角元全正→必正定→Gershgorin圆盘定理推论。Cauchy-Schwarz→正定矩阵定义内积x,yA=xAy\langle x,y\rangle_A=x'Ay→该内积空间几何→马氏距离即基于Σ1\Sigma^{-1}内积的距离。

矩阵平方根:PSD矩阵存在唯一PSD平方根A1/2A^{1/2}→满足A1/2A1/2=AA^{1/2}A^{1/2}=A→计量中如White标准误的构造。Ridge回归XXX'XPSD但可能近奇异→加入λI(λ>0)\lambda I(\lambda>0)XX+λIX'X+\lambda I强制正定→岭回归的数值稳定化本质即正定性保障。

记忆:正定→所有特征值>0>0→Sylvester主子式全正→二阶充分条件/协方差满秩。半正定→特征值0\ge0→协方差半正定性是天然的→但不保证唯一解。二者差距仅"严格与否"→恰如严格凸与凸的差距→贯穿经济数学全领域。