ARTICLE

合同变换

合同变换 (Congruence Transformation) 合同变换(Congruence Transformation)是线性代数与矩阵理论中的一种基本变换,指将一个 n n 方阵 A 通过可逆矩阵 P 变换为 P^ T A P 的形式。与相似变换 P^-1 A P 不同,合同变换使用转置而非逆矩阵,因而在对称矩阵与二次型的研究中占据核心地位。该概念

浏览 0 更新 2025-12-09

合同变换 (Congruence Transformation)

合同变换(Congruence Transformation)是线性代数与矩阵理论中的一种基本变换,指将一个 n×n n \times n 方阵 A A 通过可逆矩阵 P P 变换为 PTAP P^{\mathsf{T}} A P 的形式。与相似变换 P1AP P^{-1} A P 不同,合同变换使用转置而非逆矩阵,因而在对称矩阵与二次型的研究中占据核心地位。该概念最早隐含于 Lagrange 和 Gauss 对二次型分类的工作中,后由 Sylvester 系统化为惯性定律,现广泛应用于经济学、优化理论、数值分析和微分几何等领域。

定义与基本性质

ARn×n A \in \mathbb{R}^{n \times n} 为实方阵,P P n×n n \times n 实可逆矩阵。称变换

A    PTAPA \;\longmapsto\; P^{\mathsf{T}} A P

为对 A A 的一个合同变换。若存在可逆 P P 使得 B=PTAP B = P^{\mathsf{T}} A P ,则称 A A B B 合同(congruent),记为 AB A \cong B

合同关系具有以下基本性质:

  • 自反性AA A \cong A (取 P=I P = I )。
  • 对称性:若 AB A \cong B ,则 BA B \cong A B=PTAP B = P^{\mathsf{T}} A P 意味着 A=(P1)TBP1 A = (P^{-1})^{\mathsf{T}} B P^{-1} )。
  • 传递性:若 AB A \cong B BC B \cong C ,则 AC A \cong C 。因此合同关系是等价关系。
  • 对称保持:若 A A 是对称矩阵,则 PTAP P^{\mathsf{T}} A P 亦对称。这是因为 (PTAP)T=PTATP=PTAP (P^{\mathsf{T}} A P)^{\mathsf{T}} = P^{\mathsf{T}} A^{\mathsf{T}} P = P^{\mathsf{T}} A P 。故此变换天然适用于对称矩阵。
  • 秩不变rank(PTAP)=rank(A) \operatorname{rank}(P^{\mathsf{T}} A P) = \operatorname{rank}(A) ,因 P P 可逆保证矩阵乘法不改变秩。
  • 符号差不变(Sylvester 惯性定律):实对称矩阵在合同变换下,正特征值个数、负特征值个数与零特征值个数保持不变——这是合同变换最深刻的性质。

Sylvester 惯性定律

Sylvester 惯性定律是合同变换的理论基石。对任意实对称矩阵 A A ,存在可逆矩阵 P P 将其合同对角化:

PTAP=diag(1,,1p,1,,1q,0,,0r)P^{\mathsf{T}} A P = \operatorname{diag}\big(\underbrace{1, \ldots, 1}_{p}, \underbrace{-1, \ldots, -1}_{q}, \underbrace{0, \ldots, 0}_{r}\big)

其中 (p,q,r) (p, q, r) 称为 A A 惯性指数(inertia):p p 为正惯性指数,q q 为负惯性指数,r r 为零惯性指数(p+q+r=n p + q + r = n )。该三元组在合同变换下保持不变。换言之,合同的实对称矩阵具有完全相同的惯性指数——合同分类完全由惯性指数刻画。

惯性定律的一个重要推论是正定矩阵p=n p = n )、负定矩阵q=n q = n )与不定矩阵p>0,q>0 p > 0, q > 0 )在合同变换下保持不变。这意味着正定性是合同的等价类不变量,对经济学中的二阶条件分析意义重大。

合同变换与二次型

二次型 Q(x)=xTAx Q(\mathbf{x}) = \mathbf{x}^{\mathsf{T}} A \mathbf{x} 在变量替换 x=Py \mathbf{x} = P \mathbf{y} 下变为:

xTAx=yT(PTAP)y\mathbf{x}^{\mathsf{T}} A \mathbf{x} = \mathbf{y}^{\mathsf{T}} (P^{\mathsf{T}} A P) \mathbf{y}

因此合同变换本质上是对二次型实施的坐标变换。选择适当的 P P 可以将二次型化为标准形(仅含平方项)或规范形(系数仅为 1,1,0 1, -1, 0 ),从而直接读出二次型的秩与符号差。这一过程无需计算特征值——通过配方法(Lagrange 方法)即可构造性地得到合同对角化。

与相似变换的区别

虽同为等价关系,合同变换与相似变换在概念上有根本区别:

  • 变换矩阵:合同用 PT P^{\mathsf{T}} ,相似用 P1 P^{-1} 。对一般 P P PTP1 P^{\mathsf{T}} \neq P^{-1} ,除非 P P 是正交矩阵——此时合同与相似重合。
  • 不变量:合同不变量为惯性指数(符号差);相似不变量为特征值(包括代数重数与几何重数)和 Jordan 标准形。
  • 适用范围:合同变换自然作用于对称矩阵的二次型表示;相似变换适用于一般线性变换在不同基下的矩阵表示。
  • 几何意义:合同变换对应于二次曲面的坐标变换(保留几何形状的分类);相似变换对应于同一线性变换在不同基下的矩阵表示。

当且仅当 P P 是正交矩阵(PT=P1 P^{\mathsf{T}} = P^{-1} )时,两变换一致,此时 PTAP=P1AP P^{\mathsf{T}} A P = P^{-1} A P 同时产生合同对角化与谱分解。

经济学中的应用

合同变换在经济学中有着深刻且具体的应用场景:

消费者理论中的 Slutsky 矩阵Slutsky 方程将价格变化的总效应分解为替代效应与收入效应。Slutsky 矩阵 S S (替代效应矩阵)是半负定的对称矩阵。根据合同变换的性质,Slutsky 矩阵的负半定性在任意可逆线性变换(如消费品重新标度或组合)下保持不变——这正是需求理论中"显示偏好"公理可进行单调变换而不改变核心结论的数学根源。具体而言,若 S0 S \preceq 0 (半负定),则对任意可逆消费束变换 P P PTSP0 P^{\mathsf{T}} S P \preceq 0 仍成立,确保了替代效应的符号性质具有基簇无关性。

优化与 Hessian 矩阵:在最优化问题中,Hessian 矩阵 H H 的二阶条件决定了极值点的性质。包络定理与隐函数定理的分析常涉及对决策变量做线性变换。若 H H 在均衡点负定(极大值点的充分条件),则经合同变换 PTHP P^{\mathsf{T}} H P 仍负定——这一不变性保证了最优性条件不受变量参数化方式的影响。

生产理论中的要素需求:在生产者理论中,要素需求函数的导数矩阵(即替代矩阵)同样具有对称性和负半定性,其惯性与生产者优化问题的二阶条件直接相关。合同变换的不变性确保了在投入品做单调变换时,要素替代弹性的符号结构得以保持。

计量经济学中的识别条件:在广义矩估计(GMM)和两阶段最小二乘法(2SLS)中,权重矩阵的选取通常要求正定性。合同变换确保了工具变量做线性变换后,估计量的渐近方差矩阵的性质不变——这是稳健推断的代数基础。

数值算法中的角色

在数值线性代数中,合同变换是LDL^{\mathsf{T}} 分解(不带平方根的 Cholesky 分解)的理论基础。对实对称矩阵 A A ,若其各阶顺序主子式非零,可唯一分解为 A=LDLT A = L D L^{\mathsf{T}} ,其中 L L 是单位下三角矩阵,D D 是对角矩阵。这实质上是一系列初等合同变换(取 P P 为初等矩阵)的结果。在不要求正定的情形下,LDL^{\mathsf{T}} 分解比 Cholesky 分解更为通用,且可通过 Bunch–Kaufman 算法推广至不定矩阵,这类算法在结构方程模型和金融风险建模中有重要应用。

总结

合同变换 APTAP A \mapsto P^{\mathsf{T}} A P 是连接矩阵理论、二次型分类与经济学分析的核心工具。它以 Sylvester 惯性定律为基石,提供了对称矩阵在坐标变换下的不变量,并在消费者理论、生产者理论和优化理论中为"变换不变性"提供了严格的代数语言。理解合同变换的本质——而非仅仅将其视为相似变换的"表亲"——对于掌握现代经济学的数学基础至关重要。在更广泛的数学框架中,合同变换还与 Lie 群 O(p,q) O(p, q) 及伪欧几里得几何存在深刻的联系,体现了代数结构与几何结构之间的统一性。