特征多项式 (Characteristic Polynomial)
特征多项式 是线性代数 中一个核心概念,它将矩阵的所有信息压缩为一个单变量多项式,其根就是该矩阵的特征值 。给定一个 n × n n \times n n × n 方阵 A \mathbf{A} A (通常定义在复数域 C \mathbb{C} C 上),其特征多项式定义为:
p A ( λ ) = det ( λ I − A ) p_{\mathbf{A}}(\lambda) = \det(\lambda \mathbf{I} - \mathbf{A}) p A ( λ ) = det ( λ I − A )
其中 I \mathbf{I} I 为 n n n 阶单位矩阵,λ \lambda λ 为未定元。展开后得到一个首项系数为 1 1 1 (即首一多项式,monic)的 n n n 次多项式:
p A ( λ ) = λ n + c n − 1 λ n − 1 + ⋯ + c 1 λ + c 0 p_{\mathbf{A}}(\lambda) = \lambda^n + c_{n-1}\lambda^{n-1} + \cdots + c_1\lambda + c_0 p A ( λ ) = λ n + c n − 1 λ n − 1 + ⋯ + c 1 λ + c 0
部分教材采用 det ( A − λ I ) \det(\mathbf{A} - \lambda\mathbf{I}) det ( A − λ I ) 的形式,两者仅相差一个符号因子 ( − 1 ) n (-1)^n ( − 1 ) n ,本质等价。本文统一采用 det ( λ I − A ) \det(\lambda\mathbf{I} - \mathbf{A}) det ( λ I − A ) 的形式以保证首项系数恒为正一。
代数结构与系数含义
特征多项式的系数与矩阵的迹 和行列式 之间存在优美的对应关系。将 p A ( λ ) p_{\mathbf{A}}(\lambda) p A ( λ ) 展开:
p A ( λ ) = λ n − ( tr A ) λ n − 1 + ⋯ + ( − 1 ) n det ( A ) p_{\mathbf{A}}(\lambda) = \lambda^n - (\operatorname{tr}\mathbf{A})\lambda^{n-1} + \cdots + (-1)^n \det(\mathbf{A}) p A ( λ ) = λ n − ( tr A ) λ n − 1 + ⋯ + ( − 1 ) n det ( A )
具体而言,λ n − k \lambda^{n-k} λ n − k 的系数等于所有 k k k 阶主子式 之和乘以 ( − 1 ) k (-1)^k ( − 1 ) k 。两个最重要的特例:
λ n − 1 \lambda^{n-1} λ n − 1 的系数:− tr ( A ) = − ∑ i = 1 n a i i -\operatorname{tr}(\mathbf{A}) = -\sum_{i=1}^n a_{ii} − tr ( A ) = − ∑ i = 1 n a ii ,即矩阵对角线元素之和的相反数。常数项:p A ( 0 ) = det ( − A ) = ( − 1 ) n det ( A ) p_{\mathbf{A}}(0) = \det(-\mathbf{A}) = (-1)^n \det(\mathbf{A}) p A ( 0 ) = det ( − A ) = ( − 1 ) n det ( A ) 。
这一展开结构源于行列式的排列展开定义:det ( λ I − A ) \det(\lambda\mathbf{I} - \mathbf{A}) det ( λ I − A ) 中每个排列项从矩阵的 n n n 个位置各取一个元素相乘。对角元 ( λ − a i i ) (\lambda - a_{ii}) ( λ − a ii ) 中的 λ \lambda λ 在乘积累中贡献多项式的高次项,而非对角元的 − a i j -a_{ij} − a ij 贡献低次项。k k k 阶主子式恰好对应选取 n − k n-k n − k 个对角上的 λ \lambda λ 与一个 k × k k\times k k × k 的 ( − A ) (-\mathbf{A}) ( − A ) 子矩阵的行列式之积,由此得到系数的组合解释。特征多项式因此将矩阵的谱 性质(特征值全体)与代数量(迹、主子式)通过多项式理论自然桥接。值得注意的是,特征多项式的系数是初等对称多项式 在特征值上的取值:若 λ 1 , … , λ n \lambda_1, \dots, \lambda_n λ 1 , … , λ n 为 A \mathbf{A} A 的全部特征值,则 p A ( λ ) = ∏ i = 1 n ( λ − λ i ) p_{\mathbf{A}}(\lambda) = \prod_{i=1}^n (\lambda - \lambda_i) p A ( λ ) = ∏ i = 1 n ( λ − λ i ) ,展开后的系数 c n − k = ( − 1 ) k e k ( λ 1 , … , λ n ) c_{n-k} = (-1)^k e_k(\lambda_1, \dots, \lambda_n) c n − k = ( − 1 ) k e k ( λ 1 , … , λ n ) ,其中 e k e_k e k 为第 k k k 个初等对称多项式。
特征值与特征向量
特征多项式的根本意义在于:λ 0 \lambda_0 λ 0 是矩阵 A \mathbf{A} A 的特征值,当且仅当 p A ( λ 0 ) = 0 p_{\mathbf{A}}(\lambda_0) = 0 p A ( λ 0 ) = 0 。这是因为 det ( λ 0 I − A ) = 0 \det(\lambda_0\mathbf{I} - \mathbf{A}) = 0 det ( λ 0 I − A ) = 0 等价于 λ 0 I − A \lambda_0\mathbf{I} - \mathbf{A} λ 0 I − A 是奇异矩阵,即存在非零向量 v \mathbf{v} v 使得 A v = λ 0 v \mathbf{A}\mathbf{v} = \lambda_0 \mathbf{v} Av = λ 0 v 。由此,求特征值问题完全等价于求特征多项式的根。根据代数基本定理 ,n n n 次多项式在复数域上恰好有 n n n 个根(计重数),故每个 n × n n \times n n × n 矩阵有恰好 n n n 个复特征值,这保证了谱的完备性。
特征值的代数重数 (algebraic multiplicity)指其作为多项式根的重数,而几何重数 (geometric multiplicity)指其对应特征空间的维数 dim ker ( A − λ I ) \dim\ker(\mathbf{A} - \lambda\mathbf{I}) dim ker ( A − λ I ) 。几何重数永不大于代数重数,两者对所有特征值均相等是矩阵可对角化 的充要条件。二者不相等时矩阵仅可化为若尔当标准形 ,此时特征多项式不足以完全刻画矩阵的相似类——还需借助极小多项式 。极小多项式 m A ( λ ) m_{\mathbf{A}}(\lambda) m A ( λ ) 是满足 m A ( A ) = 0 m_{\mathbf{A}}(\mathbf{A}) = \mathbf{0} m A ( A ) = 0 的次数最低的首一多项式,它整除特征多项式,且两者有完全相同的根(即特征值),仅重数可能不同。特征多项式与极小多项式一致当且仅当每个特征值的几何重数均为 1,即矩阵为循环矩阵 (每个若尔当块对应不同特征值)。
凯莱-哈密顿定理
特征多项式最深刻的性质之一是凯莱-哈密顿定理 (Cayley-Hamilton Theorem):每个方阵满足其自身的特征方程,即:
p A ( A ) = A n + c n − 1 A n − 1 + ⋯ + c 1 A + c 0 I = 0 p_{\mathbf{A}}(\mathbf{A}) = \mathbf{A}^n + c_{n-1}\mathbf{A}^{n-1} + \cdots + c_1\mathbf{A} + c_0\mathbf{I} = \mathbf{0} p A ( A ) = A n + c n − 1 A n − 1 + ⋯ + c 1 A + c 0 I = 0
这一定理具有深远意义:它意味着 A n \mathbf{A}^n A n 可以用 I , A , … , A n − 1 \mathbf{I}, \mathbf{A}, \dots, \mathbf{A}^{n-1} I , A , … , A n − 1 的线性组合表示,进而任何更高次幂 A k \mathbf{A}^k A k (k ≥ n k \ge n k ≥ n )均可降阶为低次幂的线性组合。在数值计算中,这使矩阵幂级数(如矩阵指数 e A e^{\mathbf{A}} e A )的截断计算成为可能。凯莱-哈密顿定理的一种标准证明利用了伴随矩阵的性质:adj ( λ I − A ) ⋅ ( λ I − A ) = det ( λ I − A ) I = p A ( λ ) I \operatorname{adj}(\lambda\mathbf{I} - \mathbf{A}) \cdot (\lambda\mathbf{I} - \mathbf{A}) = \det(\lambda\mathbf{I} - \mathbf{A})\mathbf{I} = p_{\mathbf{A}}(\lambda)\mathbf{I} adj ( λ I − A ) ⋅ ( λ I − A ) = det ( λ I − A ) I = p A ( λ ) I ,将 λ \lambda λ 替换为 A \mathbf{A} A 后经适当论证即得结论。该定理的另一重要应用是计算矩阵的逆 :若 A \mathbf{A} A 可逆(即 c 0 = det ( A ) ≠ 0 c_0 = \det(\mathbf{A}) \neq 0 c 0 = det ( A ) = 0 ),则由该定理可推得 A − 1 = − 1 c 0 ( A n − 1 + c n − 1 A n − 2 + ⋯ + c 1 I ) \mathbf{A}^{-1} = -\frac{1}{c_0}(\mathbf{A}^{n-1} + c_{n-1}\mathbf{A}^{n-2} + \cdots + c_1\mathbf{I}) A − 1 = − c 0 1 ( A n − 1 + c n − 1 A n − 2 + ⋯ + c 1 I ) ,将矩阵求逆转化为多项式求值。
相似不变性与计算
特征多项式是相似不变量 :若 B = P − 1 A P \mathbf{B} = \mathbf{P}^{-1}\mathbf{A}\mathbf{P} B = P − 1 AP ,则 p B ( λ ) = p A ( λ ) p_{\mathbf{B}}(\lambda) = p_{\mathbf{A}}(\lambda) p B ( λ ) = p A ( λ ) 。证明直接:
p B ( λ ) = det ( λ I − P − 1 A P ) = det ( P − 1 ( λ I − A ) P ) = det ( λ I − A ) = p A ( λ ) p_{\mathbf{B}}(\lambda) = \det(\lambda\mathbf{I} - \mathbf{P}^{-1}\mathbf{A}\mathbf{P}) = \det(\mathbf{P}^{-1}(\lambda\mathbf{I} - \mathbf{A})\mathbf{P}) = \det(\lambda\mathbf{I} - \mathbf{A}) = p_{\mathbf{A}}(\lambda) p B ( λ ) = det ( λ I − P − 1 AP ) = det ( P − 1 ( λ I − A ) P ) = det ( λ I − A ) = p A ( λ )
这保证了特征多项式仅依赖于矩阵所代表的线性变换 本身,与基的选取无关。因此特征多项式(及其导出的迹和行列式)构成线性变换的完全不变量族中的核心成员。对于大型矩阵,利用海森伯格形 或Faddeev-LeVerrier算法 可高效计算特征多项式的系数,复杂度约为 O ( n 4 ) O(n^4) O ( n 4 ) ;实际数值计算中更常见的是直接求解特征值(如QR算法 )而非显式计算多项式系数,以避免高阶多项式的数值不稳定性。对于三对角或友矩阵 (companion matrix)等特殊结构的矩阵,特征多项式可直接写出:友矩阵 C \mathbf{C} C 的第一行为 − c 0 , − c 1 , … , − c n − 1 -c_0, -c_1, \dots, -c_{n-1} − c 0 , − c 1 , … , − c n − 1 时,p C ( λ ) = λ n + c n − 1 λ n − 1 + ⋯ + c 0 p_{\mathbf{C}}(\lambda) = \lambda^n + c_{n-1}\lambda^{n-1} + \cdots + c_0 p C ( λ ) = λ n + c n − 1 λ n − 1 + ⋯ + c 0 。友矩阵的这一性质使任何首一多项式均可实现为某个矩阵的特征多项式,从而在理论上建立了多项式与线性变换之间的一一对应。
应用
特征多项式在多个学科中起关键作用。在微分方程 中,常系数线性系统 d x / d t = A x d\mathbf{x}/dt = \mathbf{A}\mathbf{x} d x / d t = Ax 的解结构完全由特征多项式所决定的特征值确定——实部决定稳定性,虚部决定振荡频率,因此无需完全求解即可判断系统的长期行为。在图论 中,图的邻接矩阵 和拉普拉斯矩阵 的特征多项式(合称图的谱 )与图的连通性、二分性和扩张性质密切相关:例如拉普拉斯矩阵特征多项式的次小根(代数连通度)衡量图的连通鲁棒性。在控制理论 中,闭环系统的极点 配置问题归结为使状态反馈矩阵的特征多项式等于期望多项式,这直接联系到能控性 和阿克曼公式 。在计量经济学 的向量自回归 (VAR)模型中,伴随矩阵的特征多项式根全部位于单位圆内是系统平稳性 的充要条件。在量子力学 中,哈密顿算符 在有限维表示下的特征多项式决定系统的能量本征值谱。特征多项式将高维线性结构的谱信息浓缩为多项式代数,实现了从线性代数到多项式理论再到微分方程和动力系统的桥梁,是理论分析与工程应用中不可或缺的核心工具。
关于知经 KNOWECON
知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌,长期面向北京大学、清华大学、中国人民大学等顶尖院校,提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考,并成功进入理想院校。
知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业,获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者,长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。
我们相信,好的考研辅导不只是押题和陪跑,更是把复杂知识讲清楚、把复习路径设计清楚,并用技术让学习过程更可追踪、更可反馈、更可坚持。