ARTICLE

Hermite矩阵

Hermite矩阵 (Hermitian Matrix) Hermite矩阵(Hermitian matrix),亦常译作埃尔米特矩阵或自伴矩阵,是线性代数与泛函分析中最重要的矩阵类之一:一个复方阵等于自身的共轭转置。它在数学上推广了实对称矩阵,在物理上则是量子力学的数学骨架——所有物理可观测量均由 Hermite 算子表示。Hermite矩阵得名于法国数学

浏览 0 更新 2026-01-16

Hermite矩阵 (Hermitian Matrix)

Hermite矩阵(Hermitian matrix),亦常译作埃尔米特矩阵自伴矩阵,是线性代数泛函分析中最重要的矩阵类之一:一个复方阵等于自身的共轭转置。它在数学上推广了实对称矩阵,在物理上则是量子力学的数学骨架——所有物理可观测量均由 Hermite 算子表示。Hermite矩阵得名于法国数学家Charles Hermite(1822--1901),其工作奠定了 Hermite 二次型理论的基础。

定义与基本性质

ACn×nA \in \mathbb{C}^{n \times n} 为复方阵,其共轭转置记为 AA^*A=ATA^\dagger = \overline{A}^{\mathsf{T}}。若满足

A=AA = A^*

即对任意指标 i,ji, jAij=AjiA_{ij} = \overline{A_{ji}},则称 AA 为 Hermite 矩阵。由定义立即可得对角元均为实数:Aii=AiiA_{ii} = \overline{A_{ii}}。实 Hermite 矩阵恰退化为通常的对称矩阵,因此 Hermite 矩阵可视为对称矩阵在复数域上最自然的推广。

Hermite 矩阵对加法和实数标量乘法封闭,构成实数域上的线性空间;两个 Hermite 矩阵的乘积若可交换则仍为 Hermite。任意复方阵 AA 可唯一分解为 Hermite 部分与斜 Hermite 部分之和:

A=A+A2+AA2A = \frac{A + A^*}{2} + \frac{A - A^*}{2}

此即矩阵的 Cartesian 分解,与复数分解为实部加虚部 z=Rez+iImzz = \operatorname{Re} z + i \operatorname{Im} z 完全平行。

Hermite 矩阵与半双线性型(Sesquilinear Form)有本质联系。映射 x,yA=yAx\langle x, y \rangle_A = y^* A xAA 为 Hermite 时满足共轭对称性 x,y=y,x\langle x, y \rangle = \overline{\langle y, x \rangle},正定 Hermite 矩阵则定义了一个复内积。此视角揭示 Hermite 矩阵不仅是算子,更是几何结构的编码——每一正定 Hermite 矩阵对应复向量空间上的一种度量。

特征值全为实数的核心定理

Hermite 矩阵最深刻且最具实用价值的性质是:所有特征值均为实数。设 λ\lambdaAA 的任意特征值,x0x \neq 0 为相应的特征向量,满足 Ax=λxAx = \lambda x。以 xx^* 左乘两端:

xAx=λ(xx)x^* A x = \lambda (x^* x)

取共轭转置,利用 A=AA = A^*xAxx^* A x 为实数(等于自身的共轭),而 xx=x2>0x^* x = \|x\|^2 > 0,故 λ\lambda 必为实数。

更进一步,对应于不同特征值的特征向量必然正交。若 λ1λ2\lambda_1 \neq \lambda_2Ax1=λ1x1Ax_1 = \lambda_1 x_1Ax2=λ2x2Ax_2 = \lambda_2 x_2,则:

λ1(x1x2)=x1Ax2=(x2Ax1)=(λ1x2x1)=λ1x1x2\lambda_1 (x_1^* x_2) = x_1^* A x_2 = (x_2^* A x_1)^* = (\lambda_1 x_2^* x_1)^* = \lambda_1^* x_1^* x_2

利用 λ1=λ1\lambda_1^* = \lambda_1λ1λ2\lambda_1 \neq \lambda_2 即得 x1x2=0x_1^* x_2 = 0。即便遭遇重特征值,亦可经由 Gram-Schmidt 正交化选出一组标准正交特征向量。

谱定理与酉对角化

上述性质汇流为 Hermite 矩阵的谱定理(Spectral Theorem):对任意 Hermite 矩阵 AA,存在酉矩阵 UU(满足 UU=IU^* U = I)使

A=UΛUA = U \Lambda U^*

其中 Λ=diag(λ1,,λn)\Lambda = \operatorname{diag}(\lambda_1, \ldots, \lambda_n),所有 λiR\lambda_i \in \mathbb{R}。换言之,Hermite 矩阵可被酉对角化——这是实对称矩阵正交对角化在复空间上的完美推广。等价表述为:Cn\mathbb{C}^n 存在一组由 AA 的特征向量构成的标准正交基。此结论使 Hermite 矩阵与对角化特征值正规矩阵理论深刻交织。

Hermite 矩阵是正规矩阵(满足 AA=AAA A^* = A^* A)的特例:正规矩阵均可酉对角化,但仅 Hermite 矩阵对角化为纯实数。与之对偶的斜 Hermite 矩阵A=AA = -A^*)特征值全为纯虚数,可由 Hermite 矩阵乘以 ii 得到。

Hermite 矩阵与酉矩阵通过矩阵指数映射深邃相连:对任意 Hermite 矩阵 AAeiAe^{iA} 必为酉矩阵;反之,对任意酉矩阵 UU,存在 Hermite 矩阵 AA 使 U=eiAU = e^{iA}。此对应是 Lie 群 U(n)\mathrm{U}(n) 与其 Lie 代数 u(n)\mathfrak{u}(n)(即斜 Hermite 矩阵构成的实空间)关系的矩阵体现。另一经典桥梁是 Cayley 变换:若 AA 为 Hermite 且 1-1 非其特征值,则 U=(AiI)(A+iI)1U = (A - iI)(A + iI)^{-1} 为酉矩阵,该变换在数值分析与信号处理中频繁出现。

正定性与 Rayleigh 商

若 Hermite 矩阵 AA 满足对所有非零 xCnx \in \mathbb{C}^nxAx>0x^* A x > 0,则称 AA正定 Hermite 矩阵。等价条件包括:所有特征值严格大于零;所有顺序主子式为正。若只要求非负则为半正定。正定 Hermite 矩阵保证 Cholesky 分解 A=LLA = L L^*LL 为下三角)的存在唯一性,在数值线性代数、统计学(协方差矩阵)、最优化(牛顿法)中广泛应用。

对一般 Hermite 矩阵可定义 Rayleigh 商

R(x)=xAxxx,x0R(x) = \frac{x^* A x}{x^* x}, \quad x \neq 0

Rayleigh 商恒为实数且取值介于最小与最大特征值之间。Courant-Fischer 极小极大定理以子空间极值精确刻画第 kk 大特征值:

λk=mindimV=kmaxxV{0}R(x)=maxdimV=nk+1minxV{0}R(x)\lambda_k = \min_{\dim V = k} \max_{x \in V \setminus \{0\}} R(x) = \max_{\dim V = n-k+1} \min_{x \in V \setminus \{0\}} R(x)

此变分刻画是研究特征值扰动特征值交织定理(Cauchy 交织)与 Weyl 不等式的理论基石。

Hermite 矩阵之间可引入 Loewner 偏序:定义 ABA \succeq B 当且仅当 ABA - B 半正定。此偏序在凸优化、随机矩阵理论与量子信息中广泛使用。例如矩阵函数 f(A)f(A) 的单调性(若 ABA \succeq B 是否蕴含 f(A)f(B)f(A) \succeq f(B))与 Löwner 定理紧密相关。此外, Weyl 不等式给出了 Hermite 矩阵之和的特征值上下界:对任意 A,BA, B Hermite,λi+j1(A+B)λi(A)+λj(B)\lambda_{i+j-1}(A+B) \leq \lambda_i(A) + \lambda_j(B),这一结论是特征值扰动理论的支柱。

量子力学中的 Hermite 算子

量子力学的数学形式化中,物理可观测量——位置、动量、角动量、能量、自旋——均由(无穷维)Hilbert 空间上的自伴算子(Hermite 算子的泛函推广)表示。实特征值确保测量结果为实数,正交特征向量则对应不同测量结果的本征态之间互不相干。薛定谔方程中的 Hamilton 量 H^\hat{H} 即为 Hermite 算子,其谱分解给出量子系统的所有可能能级;不确定性关系的推导亦根植于 Hermite 算子的非对易代数结构。测量后态的波函数坍缩假说——系统以概率 cn2|c_n|^2 坍缩至某本征态——亦以 Hermite 算子的谱分解 A=nannnA = \sum_n a_n |n\rangle\langle n| 为代数前提。

工程与计算中的 Hermite 矩阵

Hermite 正定矩阵在工程中扮演关键角色。控制理论中,Lyapunov 方程 AP+PA=QA^* P + P A = -Q 的解 PP 为 Hermite 正定,用于判定系统稳定性。MIMO 通信系统中,信道矩阵经 Hermite 变换 HHH^* H 后刻画信道容量。谱聚类主成分分析等机器学习方法的核矩阵常为 Hermite(或实对称),其谱分解构成算法核心。此外,共轭梯度法等大规模线性系统求解器依赖于 Hermite 正定结构以实现快速收敛。

在统计学中,多元正态分布的协方差矩阵为 Hermite(实情形为对称)正定矩阵,其极大似然估计涉及 Hermite 矩阵的行列式与逆的梯度计算。随机矩阵理论中的 Wishart 分布——样本协方差矩阵的分布——定义于 Hermite 正定锥上,在高维统计与压缩感知中有核心地位。纯数学方面,Hermite 于 1855 年证明了 ee 的超越性,其矩阵冠名工作则源自对二次型分类问题的系统研究,至今已渗透至现代数学物理的几乎所有分支。