ARTICLE

对称矩阵

对称矩阵 (Symmetric Matrix) 对称矩阵 (Symmetric Matrix) 是线性代数中一类极为重要的方阵 (Square Matrix)。一个方阵 A 如果等于其自身的转置 (Transpose),则称其为对称矩阵。 具体而言,如果一个 n n 的方阵 A = (a_ij) 满足: 或者从元素层面来看,对于所有的 i 和 j(其中 1

浏览 61 更新 2025-10-26

对称矩阵 (Symmetric Matrix)

对称矩阵 (Symmetric Matrix) 是线性代数中一类极为重要的方阵 (Square Matrix)。一个方阵 AA 如果等于其自身的转置 (Transpose),则称其为对称矩阵。

具体而言,如果一个 n×nn \times n 的方阵 A=(aij)A = (a_{ij}) 满足:

A=ATA = A^T

或者从元素层面来看,对于所有的 iijj(其中 1i,jn1 \le i, j \le n),都有:

aij=ajia_{ij} = a_{ji}

那么 AA 就是一个对称矩阵。这意味着矩阵的元素关于其主对角线 (Main Diagonal)(从左上到右下的对角线)是镜像对称的。

示例

一个 2×22 \times 2 的对称矩阵及其转置:

A=(1557),AT=(1557)A = \begin{pmatrix} 1 & 5 \\ 5 & -7 \end{pmatrix}, \quad A^T = \begin{pmatrix} 1 & 5 \\ 5 & -7 \end{pmatrix}

一个 3×33 \times 3 的对称矩阵及其转置:

B=(420291013),BT=(420291013)B = \begin{pmatrix} 4 & -2 & 0 \\ -2 & 9 & 1 \\ 0 & 1 & -3 \end{pmatrix}, \quad B^T = \begin{pmatrix} 4 & -2 & 0 \\ -2 & 9 & 1 \\ 0 & 1 & -3 \end{pmatrix}

基本代数性质

对称矩阵具有以下优良的代数性质:

线性组合

任意两个 n×nn \times n 对称矩阵的和仍然是对称矩阵。若 AABB 是对称矩阵,则 (A+B)T=AT+BT=A+B(A+B)^T = A^T + B^T = A+B。一个对称矩阵的标量乘法结果仍然是对称矩阵:若 AA 对称,cc 为标量,则 (cA)T=cAT=cA(cA)^T = cA^T = cA。因此,所有 n×nn \times n 实对称矩阵构成所有 n×nn \times n 实矩阵所组成的向量空间的一个子空间,其维数为 n(n+1)2\frac{n(n+1)}{2}

矩阵乘积

两个对称矩阵 AABB 的乘积 ABAB 不一定是对称矩阵。ABAB 为对称矩阵的充分必要条件是 AABB交换 (Commute),即 AB=BAAB = BA

证明

(AB)T=BTAT(AB)^T = B^T A^T。因 AABB 对称,故 BT=BB^T = BAT=AA^T = A,因此 (AB)T=BA(AB)^T = BA。若要使 ABAB 对称,则需 (AB)T=AB(AB)^T = AB,这等价于 BA=ABBA = AB

对于任意一个 m×nm \times n 矩阵 AA(不一定是方阵),ATAA^T AAATA A^T 都是对称矩阵。

证明

(ATA)T=AT(AT)T=ATA(A^T A)^T = A^T (A^T)^T = A^T A,同理 (AAT)T=(AT)TAT=AAT(A A^T)^T = (A^T)^T A^T = A A^T

这一性质在统计学中极为重要,因为协方差矩阵正是以此种形式构造的。

逆矩阵

如果一个对称矩阵 AA可逆矩阵,那么它的逆矩阵 A1A^{-1} 也一定是对称矩阵。

证明

已知 (A1)T=(AT)1(A^{-1})^T = (A^T)^{-1}。因 AA 对称,有 AT=AA^T = A,因此 (A1)T=A1(A^{-1})^T = A^{-1}

谱定理 (Spectral Theorem)

对称矩阵最重要的特性体现在其特征值 (Eigenvalues) 和特征向量 (Eigenvectors) 上,这由谱定理 (Spectral Theorem) 深刻揭示。谱定理是线性代数的核心结果之一。

对于一个 n×nn \times n 的实对称矩阵 AA,谱定理包含以下三个核心结论:

  1. 所有特征值均为实数:对称矩阵的特征值不可能是非实的复数。 \begin{proof} 设 λ\lambda 为特征值,v\mathbf{v} 为对应特征向量,满足 Av=λvA\mathbf{v} = \lambda\mathbf{v}。考察 vAv\mathbf{v}^* A \mathbf{v}(其中 v\mathbf{v}^*v\mathbf{v}共轭转置),可证明 λ\lambda 必须等于其自身共轭,因此 λ\lambda实数。 \end{proof}
  2. 不同特征值对应的特征向量相互正交:若 λ1λ2\lambda_1 \neq \lambda_2,其对应特征向量 v1\mathbf{v}_1v2\mathbf{v}_2 必定正交,即 v1Tv2=0\mathbf{v}_1^T \mathbf{v}_2 = 0。 \begin{proof} 考虑标量 v1TAv2\mathbf{v}_1^T A \mathbf{v}_2。一方面它等于 λ2(v1Tv2)\lambda_2(\mathbf{v}_1^T \mathbf{v}_2),另一方面利用 A=ATA = A^T,它也等于 λ1(v1Tv2)\lambda_1(\mathbf{v}_1^T \mathbf{v}_2)。因此 (λ1λ2)(v1Tv2)=0(\lambda_1 - \lambda_2)(\mathbf{v}_1^T \mathbf{v}_2) = 0。因 λ1λ2\lambda_1 \neq \lambda_2,故 v1Tv2=0\mathbf{v}_1^T \mathbf{v}_2 = 0。 \end{proof}
  3. 正交可对角化:存在一个正交矩阵 PP 和一个对角矩阵 DD,使得: \[ A = PDP^T = PDP^{-1} \] 其中 PP 的列为 AAnn 个相互正交且单位化的特征向量,构成标准正交基DD 的对角元为与 PP 中列向量一一对应的特征值。

该分解称为谱分解 (Spectral Decomposition) 或特征分解 (Eigen-decomposition),可展开为:

A=i=1nλiuiuiTA = \sum_{i=1}^{n} \lambda_i \mathbf{u}_i \mathbf{u}_i^T

其中 λi\lambda_i 为特征值,ui\mathbf{u}_i 为对应的单位特征向量。这一形式揭示了对称矩阵可被视为一系列由特征向量定义的、沿特定方向拉伸或压缩的线性组合。

主要应用

二次型与优化

任何一个二次型 q(x)=xTAxq(\mathbf{x}) = \mathbf{x}^T A \mathbf{x} 都可由对称矩阵 AA 定义。二次型的正负性质完全由 AA 的特征值决定。若所有特征值为正,则 AA正定矩阵,此时 q(x)>0q(\mathbf{x}) > 0 对所有非零 x\mathbf{x} 成立;若所有特征值非负,则 AA半正定矩阵。这在多变量微积分和优化理论中至关重要——例如,函数的Hesse矩阵为对称矩阵,其正定性是判断临界点是否为局部极小值的关键。

统计学与数据科学

协方差矩阵相关系数矩阵都是对称且半正定的,描述了多个随机变量之间的线性关系。在主成分分析 (PCA)中,通过对协方差矩阵进行谱分解,找到数据方差最大的方向(即特征值最大的特征向量),从而实现数据降维。

物理与工程学

在经典力学中,刚体的惯性张量是对称矩阵。在连续介质力学中,应力和应变张量也是对称的。在量子力学中,可观测物理量由厄米特算子表示,其有限维矩阵表示即为厄米特矩阵——这是对称矩阵在复数域的自然推广。

图论

无向图的邻接矩阵是对称矩阵(元素 aij=1a_{ij}=1 表示顶点 iijj 之间有边相连)。该矩阵的谱(特征值集合)揭示了图的许多重要结构特性,如连通性和社群结构。

复数域的推广:厄米特矩阵

对称矩阵的概念可推广到复数域。一个复数方阵 AA 若等于其自身的共轭转置 AA^*(也记作 AHA^H),则称其为厄米特矩阵 (Hermitian Matrix)

A=AA = A^*

厄米特矩阵同样拥有实数特征值,并可由酉矩阵对角化,这是正交矩阵在复数域的对应概念。厄米特矩阵在量子力学中尤为关键,因为所有可观测物理量的算符都是厄米特算子,其有限维表示为厄米特矩阵,这保证了测量值(即特征值)必为实数。