ARTICLE

方阵

方阵(Square Matrix)是指行数与列数相等的矩阵,即形如 n n 的矩阵。它是线性代数中最核心的概念之一,因为许多重要的矩阵运算与性质——如行列式、特征值、逆矩阵和迹——仅对方阵有定义或具有最完整的理论结构。方阵可以被视为向量空间上的线性自同态(即从向量空间到自身的线性映射)在选定基下的坐标表示。正因如此,方阵理论不仅构成了矩阵论的支柱,也是研究线

浏览 0 更新 2025-07-17

方阵(Square Matrix)是指行数与列数相等的矩阵,即形如 n×nn \times n 的矩阵。它是线性代数中最核心的概念之一,因为许多重要的矩阵运算与性质——如行列式、特征值、逆矩阵和迹——仅对方阵有定义或具有最完整的理论结构。方阵可以被视为向量空间上的线性自同态(即从向量空间到自身的线性映射)在选定基下的坐标表示。正因如此,方阵理论不仅构成了矩阵论的支柱,也是研究线性变换、微分方程系统、图论和量子力学等领域的数学基础。

基本类型

方阵按其结构特征可分为若干重要类型。对角矩阵是主对角线以外的元素全为零的方阵,其运算最为简单:两个对角矩阵的乘积仍为对角矩阵,且对角元素直接相乘。标量矩阵是对角矩阵的特例,其所有对角元素均相等。单位矩阵是标量矩阵的特殊情形,对角元素均为1,它在矩阵乘法中扮演类似于实数中数字1的角色。上三角矩阵和下三角矩阵分别指主对角线以下或以上的元素全为零的方阵,它们在数值线性代数中极为重要,因为高斯消元法的本质正是将一般方阵化为上三角形式。对称矩阵满足 AT=AA^\mathrm{T} = A,即矩阵关于主对角线对称,它在二次型理论与优化问题中频繁出现。正交矩阵满足 QTQ=IQ^\mathrm{T}Q = I,其列向量构成一组标准正交基,代表欧几里得空间中的旋转与反射变换。此外,幂零矩阵、对合矩阵和投影矩阵等特殊类型也在各自的数学语境中扮演着关键角色。

核心性质

方阵的核心性质围绕行列式、迹、秩和特征值四个概念展开。行列式是一个将方阵映射到标量的函数,它刻画了线性变换对体积的缩放因子:行列式为零当且仅当方阵奇异(不可逆);行列式的绝对值表示变换后平行多面体体积与原来的比值。迹是方阵主对角线元素之和,它等于所有特征值之和,在线性代数与李代数中具有深刻的几何意义。秩是方阵列空间(或行空间)的维数,它衡量了线性变换像空间的维度;满秩方阵恰好是那些可逆的方阵。特征值是方程 det(AλI)=0\det(A - \lambda I) = 0 的根,特征向量则是满足 Av=λvA\mathbf{v} = \lambda\mathbf{v} 的非零向量。特征值分解将方阵表示为 A=PDP1A = PDP^{-1} 的形式,其中 PP 的列是特征向量,DD 是对角线上排列着特征值的对角矩阵。这一分解揭示了方阵作用在线性空间上的拉伸与旋转结构,是理解动力系统稳定性和主成分分析等应用的数学基础。

可逆性与条件数

方阵的可逆性——即是否存在矩阵 BB 使得 AB=BA=IAB = BA = I——是线性代数中的核心议题。可逆方阵也被称为非奇异矩阵,其行列式不为零,列向量线性无关,且零空间仅包含零向量。逆矩阵的计算可通过高斯-若尔当消元法、伴随矩阵法或LU分解实现,但数值上从不会显式计算逆矩阵来求解线性方程组——在实际计算中,前向替换与回代远比直接求逆更为高效和稳定。条件数是衡量方阵对输入误差敏感程度的重要指标,定义为 κ(A)=AA1\kappa(A) = \|A\|\|A^{-1}\|,它在数值线性代数中扮演着核心角色:条件数越大,线性方程组的解对系数矩阵的微小扰动就越敏感,数值计算的结果也越不可靠。当条件数极大时,矩阵被称为病态矩阵,即使采用高精度算法也难以获得可信的解。

方阵分解

方阵分解是数值计算与理论分析的核心工具。LU分解将方阵分解为一个下三角矩阵与一个上三角矩阵的乘积,是高斯消元法的矩阵表达;若在分解过程中加入置换矩阵,则得到PLU分解,能够处理任意可逆方阵。QR分解将方阵分解为正交矩阵与上三角矩阵的乘积,在最小二乘问题和特征值算法中应用广泛。特征值分解适用于可对角化的方阵,将其分解为特征向量矩阵与对角矩阵的乘积形式。若尔当标准形则将特征值分解推广到了不可对角化的情形,通过若尔当块刻画了广义特征向量的结构。舒尔分解将任意方阵酉变换为上三角形式,是几乎所有特征值算法(如QR迭代法)的理论基石。谱分解是实对称矩阵特有的分解形式,它断言任何实对称矩阵都可以被正交对角化,其所有特征值为实数且特征向量相互正交,这一结论在多元统计分析和量子力学中具有根本性的意义。

应用

方阵的应用遍及数学与工程科学的各个分支。在常微分方程中,线性系统的解直接依赖于系数方阵的指数函数 eAte^{At},其计算依赖特征值分解或若尔当标准形。在马尔可夫链理论中,转移概率矩阵是方阵,平稳分布由其最大特征值对应的特征向量给出。在图论中,图的邻接矩阵和拉普拉斯矩阵均为方阵,后者的特征值谱——即谱图理论——揭示了图的连通性、划分和扩散性质。在经济学中,投入产出模型的核心是里昂惕夫矩阵,它同样是一个方阵,其可逆性决定了经济体系中部门间供给关系的可解性。在优化理论中,海森矩阵——即多元函数的二阶偏导数构成的对称方阵——的正定性决定了极值点的性质。在计算机图形学中,三维空间的旋转、缩放和投影变换均由 3×33 \times 34×44 \times 4 的方阵实现。方阵理论的深刻性在于:它以一个看似简单的定义——行数等于列数——为起点,衍生出了层次丰富、应用广泛的理论体系,成为现代科学语言中不可或缺的组成部分。