ARTICLE

特征多项式

特征多项式 (Characteristic Polynomial) 特征多项式是线性代数中一个核心概念,它将矩阵的所有信息压缩为一个单变量多项式,其根就是该矩阵的特征值。给定一个 n n 方阵 A(通常定义在复数域 C 上),其特征多项式定义为: 其中 I 为 n 阶单位矩阵, 为未定元。展开后得到一个首项系数为 1(即首一多项式,monic)的 n 次多项

浏览 0 更新 2025-11-16

特征多项式 (Characteristic Polynomial)

特征多项式线性代数中一个核心概念,它将矩阵的所有信息压缩为一个单变量多项式,其根就是该矩阵的特征值。给定一个 n×nn \times n 方阵 A\mathbf{A}(通常定义在复数域 C\mathbb{C} 上),其特征多项式定义为:

pA(λ)=det(λIA)p_{\mathbf{A}}(\lambda) = \det(\lambda \mathbf{I} - \mathbf{A})

其中 I\mathbf{I}nn 阶单位矩阵,λ\lambda 为未定元。展开后得到一个首项系数为 11(即首一多项式,monic)的 nn 次多项式:

pA(λ)=λn+cn1λn1++c1λ+c0p_{\mathbf{A}}(\lambda) = \lambda^n + c_{n-1}\lambda^{n-1} + \cdots + c_1\lambda + c_0

部分教材采用 det(AλI)\det(\mathbf{A} - \lambda\mathbf{I}) 的形式,两者仅相差一个符号因子 (1)n(-1)^n,本质等价。本文统一采用 det(λIA)\det(\lambda\mathbf{I} - \mathbf{A}) 的形式以保证首项系数恒为正一。

代数结构与系数含义

特征多项式的系数与矩阵的行列式之间存在优美的对应关系。将 pA(λ)p_{\mathbf{A}}(\lambda) 展开:

pA(λ)=λn(trA)λn1++(1)ndet(A)p_{\mathbf{A}}(\lambda) = \lambda^n - (\operatorname{tr}\mathbf{A})\lambda^{n-1} + \cdots + (-1)^n \det(\mathbf{A})

具体而言,λnk\lambda^{n-k} 的系数等于所有 kk主子式之和乘以 (1)k(-1)^k。两个最重要的特例:

  • λn1\lambda^{n-1} 的系数:tr(A)=i=1naii-\operatorname{tr}(\mathbf{A}) = -\sum_{i=1}^n a_{ii},即矩阵对角线元素之和的相反数。
  • 常数项:pA(0)=det(A)=(1)ndet(A)p_{\mathbf{A}}(0) = \det(-\mathbf{A}) = (-1)^n \det(\mathbf{A})

这一展开结构源于行列式的排列展开定义:det(λIA)\det(\lambda\mathbf{I} - \mathbf{A}) 中每个排列项从矩阵的 nn 个位置各取一个元素相乘。对角元 (λaii)(\lambda - a_{ii}) 中的 λ\lambda 在乘积累中贡献多项式的高次项,而非对角元的 aij-a_{ij} 贡献低次项。kk 阶主子式恰好对应选取 nkn-k 个对角上的 λ\lambda 与一个 k×kk\times k(A)(-\mathbf{A}) 子矩阵的行列式之积,由此得到系数的组合解释。特征多项式因此将矩阵的性质(特征值全体)与代数量(迹、主子式)通过多项式理论自然桥接。值得注意的是,特征多项式的系数是初等对称多项式在特征值上的取值:若 λ1,,λn\lambda_1, \dots, \lambda_nA\mathbf{A} 的全部特征值,则 pA(λ)=i=1n(λλi)p_{\mathbf{A}}(\lambda) = \prod_{i=1}^n (\lambda - \lambda_i),展开后的系数 cnk=(1)kek(λ1,,λn)c_{n-k} = (-1)^k e_k(\lambda_1, \dots, \lambda_n),其中 eke_k 为第 kk 个初等对称多项式。

特征值与特征向量

特征多项式的根本意义在于:λ0\lambda_0 是矩阵 A\mathbf{A} 的特征值,当且仅当 pA(λ0)=0p_{\mathbf{A}}(\lambda_0) = 0。这是因为 det(λ0IA)=0\det(\lambda_0\mathbf{I} - \mathbf{A}) = 0 等价于 λ0IA\lambda_0\mathbf{I} - \mathbf{A} 是奇异矩阵,即存在非零向量 v\mathbf{v} 使得 Av=λ0v\mathbf{A}\mathbf{v} = \lambda_0 \mathbf{v}。由此,求特征值问题完全等价于求特征多项式的根。根据代数基本定理nn 次多项式在复数域上恰好有 nn 个根(计重数),故每个 n×nn \times n 矩阵有恰好 nn 个复特征值,这保证了谱的完备性。

特征值的代数重数(algebraic multiplicity)指其作为多项式根的重数,而几何重数(geometric multiplicity)指其对应特征空间的维数 dimker(AλI)\dim\ker(\mathbf{A} - \lambda\mathbf{I})。几何重数永不大于代数重数,两者对所有特征值均相等是矩阵可对角化的充要条件。二者不相等时矩阵仅可化为若尔当标准形,此时特征多项式不足以完全刻画矩阵的相似类——还需借助极小多项式。极小多项式 mA(λ)m_{\mathbf{A}}(\lambda) 是满足 mA(A)=0m_{\mathbf{A}}(\mathbf{A}) = \mathbf{0} 的次数最低的首一多项式,它整除特征多项式,且两者有完全相同的根(即特征值),仅重数可能不同。特征多项式与极小多项式一致当且仅当每个特征值的几何重数均为 1,即矩阵为循环矩阵(每个若尔当块对应不同特征值)。

凯莱-哈密顿定理

特征多项式最深刻的性质之一是凯莱-哈密顿定理(Cayley-Hamilton Theorem):每个方阵满足其自身的特征方程,即:

pA(A)=An+cn1An1++c1A+c0I=0p_{\mathbf{A}}(\mathbf{A}) = \mathbf{A}^n + c_{n-1}\mathbf{A}^{n-1} + \cdots + c_1\mathbf{A} + c_0\mathbf{I} = \mathbf{0}

这一定理具有深远意义:它意味着 An\mathbf{A}^n 可以用 I,A,,An1\mathbf{I}, \mathbf{A}, \dots, \mathbf{A}^{n-1} 的线性组合表示,进而任何更高次幂 Ak\mathbf{A}^kknk \ge n)均可降阶为低次幂的线性组合。在数值计算中,这使矩阵幂级数(如矩阵指数 eAe^{\mathbf{A}})的截断计算成为可能。凯莱-哈密顿定理的一种标准证明利用了伴随矩阵的性质:adj(λIA)(λIA)=det(λIA)I=pA(λ)I\operatorname{adj}(\lambda\mathbf{I} - \mathbf{A}) \cdot (\lambda\mathbf{I} - \mathbf{A}) = \det(\lambda\mathbf{I} - \mathbf{A})\mathbf{I} = p_{\mathbf{A}}(\lambda)\mathbf{I},将 λ\lambda 替换为 A\mathbf{A} 后经适当论证即得结论。该定理的另一重要应用是计算矩阵的逆:若 A\mathbf{A} 可逆(即 c0=det(A)0c_0 = \det(\mathbf{A}) \neq 0),则由该定理可推得 A1=1c0(An1+cn1An2++c1I)\mathbf{A}^{-1} = -\frac{1}{c_0}(\mathbf{A}^{n-1} + c_{n-1}\mathbf{A}^{n-2} + \cdots + c_1\mathbf{I}),将矩阵求逆转化为多项式求值。

相似不变性与计算

特征多项式是相似不变量:若 B=P1AP\mathbf{B} = \mathbf{P}^{-1}\mathbf{A}\mathbf{P},则 pB(λ)=pA(λ)p_{\mathbf{B}}(\lambda) = p_{\mathbf{A}}(\lambda)。证明直接:

pB(λ)=det(λIP1AP)=det(P1(λIA)P)=det(λIA)=pA(λ)p_{\mathbf{B}}(\lambda) = \det(\lambda\mathbf{I} - \mathbf{P}^{-1}\mathbf{A}\mathbf{P}) = \det(\mathbf{P}^{-1}(\lambda\mathbf{I} - \mathbf{A})\mathbf{P}) = \det(\lambda\mathbf{I} - \mathbf{A}) = p_{\mathbf{A}}(\lambda)

这保证了特征多项式仅依赖于矩阵所代表的线性变换本身,与基的选取无关。因此特征多项式(及其导出的迹和行列式)构成线性变换的完全不变量族中的核心成员。对于大型矩阵,利用海森伯格形Faddeev-LeVerrier算法可高效计算特征多项式的系数,复杂度约为 O(n4)O(n^4);实际数值计算中更常见的是直接求解特征值(如QR算法)而非显式计算多项式系数,以避免高阶多项式的数值不稳定性。对于三对角或友矩阵(companion matrix)等特殊结构的矩阵,特征多项式可直接写出:友矩阵 C\mathbf{C} 的第一行为 c0,c1,,cn1-c_0, -c_1, \dots, -c_{n-1} 时,pC(λ)=λn+cn1λn1++c0p_{\mathbf{C}}(\lambda) = \lambda^n + c_{n-1}\lambda^{n-1} + \cdots + c_0。友矩阵的这一性质使任何首一多项式均可实现为某个矩阵的特征多项式,从而在理论上建立了多项式与线性变换之间的一一对应。

应用

特征多项式在多个学科中起关键作用。在微分方程中,常系数线性系统 dx/dt=Axd\mathbf{x}/dt = \mathbf{A}\mathbf{x} 的解结构完全由特征多项式所决定的特征值确定——实部决定稳定性,虚部决定振荡频率,因此无需完全求解即可判断系统的长期行为。在图论中,图的邻接矩阵拉普拉斯矩阵的特征多项式(合称图的)与图的连通性、二分性和扩张性质密切相关:例如拉普拉斯矩阵特征多项式的次小根(代数连通度)衡量图的连通鲁棒性。在控制理论中,闭环系统的极点配置问题归结为使状态反馈矩阵的特征多项式等于期望多项式,这直接联系到能控性阿克曼公式。在计量经济学向量自回归(VAR)模型中,伴随矩阵的特征多项式根全部位于单位圆内是系统平稳性的充要条件。在量子力学中,哈密顿算符在有限维表示下的特征多项式决定系统的能量本征值谱。特征多项式将高维线性结构的谱信息浓缩为多项式代数,实现了从线性代数到多项式理论再到微分方程和动力系统的桥梁,是理论分析与工程应用中不可或缺的核心工具。