ARTICLE
合同变换
合同变换 (Congruence Transformation) 合同变换(Congruence Transformation)是线性代数与矩阵理论中的一种基本变换,指将一个 n n 方阵 A 通过可逆矩阵 P 变换为 P^ T A P 的形式。与相似变换 P^-1 A P 不同,合同变换使用转置而非逆矩阵,因而在对称矩阵与二次型的研究中占据核心地位。该概念
合同变换 (Congruence Transformation)
合同变换(Congruence Transformation)是线性代数与矩阵理论中的一种基本变换,指将一个 方阵 通过可逆矩阵 变换为 的形式。与相似变换 不同,合同变换使用转置而非逆矩阵,因而在对称矩阵与二次型的研究中占据核心地位。该概念最早隐含于 Lagrange 和 Gauss 对二次型分类的工作中,后由 Sylvester 系统化为惯性定律,现广泛应用于经济学、优化理论、数值分析和微分几何等领域。
定义与基本性质
设 为实方阵, 为 实可逆矩阵。称变换
为对 的一个合同变换。若存在可逆 使得 ,则称 与 合同(congruent),记为 。
合同关系具有以下基本性质:
- 自反性:(取 )。
- 对称性:若 ,则 ( 意味着 )。
- 传递性:若 且 ,则 。因此合同关系是等价关系。
- 对称保持:若 是对称矩阵,则 亦对称。这是因为 。故此变换天然适用于对称矩阵。
- 秩不变:,因 可逆保证矩阵乘法不改变秩。
- 符号差不变(Sylvester 惯性定律):实对称矩阵在合同变换下,正特征值个数、负特征值个数与零特征值个数保持不变——这是合同变换最深刻的性质。
Sylvester 惯性定律
Sylvester 惯性定律是合同变换的理论基石。对任意实对称矩阵 ,存在可逆矩阵 将其合同对角化:
其中 称为 的惯性指数(inertia): 为正惯性指数, 为负惯性指数, 为零惯性指数()。该三元组在合同变换下保持不变。换言之,合同的实对称矩阵具有完全相同的惯性指数——合同分类完全由惯性指数刻画。
惯性定律的一个重要推论是正定矩阵()、负定矩阵()与不定矩阵()在合同变换下保持不变。这意味着正定性是合同的等价类不变量,对经济学中的二阶条件分析意义重大。
合同变换与二次型
二次型 在变量替换 下变为:
因此合同变换本质上是对二次型实施的坐标变换。选择适当的 可以将二次型化为标准形(仅含平方项)或规范形(系数仅为 ),从而直接读出二次型的秩与符号差。这一过程无需计算特征值——通过配方法(Lagrange 方法)即可构造性地得到合同对角化。
与相似变换的区别
虽同为等价关系,合同变换与相似变换在概念上有根本区别:
- 变换矩阵:合同用 ,相似用 。对一般 ,,除非 是正交矩阵——此时合同与相似重合。
- 不变量:合同不变量为惯性指数(符号差);相似不变量为特征值(包括代数重数与几何重数)和 Jordan 标准形。
- 适用范围:合同变换自然作用于对称矩阵的二次型表示;相似变换适用于一般线性变换在不同基下的矩阵表示。
- 几何意义:合同变换对应于二次曲面的坐标变换(保留几何形状的分类);相似变换对应于同一线性变换在不同基下的矩阵表示。
当且仅当 是正交矩阵()时,两变换一致,此时 同时产生合同对角化与谱分解。
经济学中的应用
合同变换在经济学中有着深刻且具体的应用场景:
消费者理论中的 Slutsky 矩阵:Slutsky 方程将价格变化的总效应分解为替代效应与收入效应。Slutsky 矩阵 (替代效应矩阵)是半负定的对称矩阵。根据合同变换的性质,Slutsky 矩阵的负半定性在任意可逆线性变换(如消费品重新标度或组合)下保持不变——这正是需求理论中"显示偏好"公理可进行单调变换而不改变核心结论的数学根源。具体而言,若 (半负定),则对任意可逆消费束变换 , 仍成立,确保了替代效应的符号性质具有基簇无关性。
优化与 Hessian 矩阵:在最优化问题中,Hessian 矩阵 的二阶条件决定了极值点的性质。包络定理与隐函数定理的分析常涉及对决策变量做线性变换。若 在均衡点负定(极大值点的充分条件),则经合同变换 仍负定——这一不变性保证了最优性条件不受变量参数化方式的影响。
生产理论中的要素需求:在生产者理论中,要素需求函数的导数矩阵(即替代矩阵)同样具有对称性和负半定性,其惯性与生产者优化问题的二阶条件直接相关。合同变换的不变性确保了在投入品做单调变换时,要素替代弹性的符号结构得以保持。
计量经济学中的识别条件:在广义矩估计(GMM)和两阶段最小二乘法(2SLS)中,权重矩阵的选取通常要求正定性。合同变换确保了工具变量做线性变换后,估计量的渐近方差矩阵的性质不变——这是稳健推断的代数基础。
数值算法中的角色
在数值线性代数中,合同变换是LDL^{\mathsf{T}} 分解(不带平方根的 Cholesky 分解)的理论基础。对实对称矩阵 ,若其各阶顺序主子式非零,可唯一分解为 ,其中 是单位下三角矩阵, 是对角矩阵。这实质上是一系列初等合同变换(取 为初等矩阵)的结果。在不要求正定的情形下,LDL^{\mathsf{T}} 分解比 Cholesky 分解更为通用,且可通过 Bunch–Kaufman 算法推广至不定矩阵,这类算法在结构方程模型和金融风险建模中有重要应用。
总结
合同变换 是连接矩阵理论、二次型分类与经济学分析的核心工具。它以 Sylvester 惯性定律为基石,提供了对称矩阵在坐标变换下的不变量,并在消费者理论、生产者理论和优化理论中为"变换不变性"提供了严格的代数语言。理解合同变换的本质——而非仅仅将其视为相似变换的"表亲"——对于掌握现代经济学的数学基础至关重要。在更广泛的数学框架中,合同变换还与 Lie 群 及伪欧几里得几何存在深刻的联系,体现了代数结构与几何结构之间的统一性。