单位矩阵 (Identity Matrix)
单位矩阵(Identity Matrix),在线性代数中通常记为 I 或 In,是一个特殊的方阵。它的主要特征是其主对角线上的元素全部为 1,而所有非主对角线上的元素全部为 0。单位矩阵在矩阵乘法中的作用,类似于数字 1 在普通乘法中的作用,因此它也被称为乘法单位元(Multiplicative Identity)。
一个 n×n 的单位矩阵 In 可以表示为:
In=10⋮001⋮0⋯⋯⋱⋯00⋮1
其中,下标 n 表示这个方阵的维度(行数和列数)。在上下文清晰的情况下,下标 n 常常被省略,直接用 I 表示。
示例
- I1=(1)
- I2=(1001)
- I3=100010001
- I4=1000010000100001
核心性质:乘法单位元
单位矩阵最核心的性质是,任何矩阵与单位矩阵相乘(在维度允许的情况下),结果都等于其本身。这就像任何数字乘以 1 结果不变一样。
形式上,对于任意一个 m×n 的矩阵 A:
AIn=A,ImA=A
重要提示:在矩阵乘法中,左乘和右乘的单位矩阵维度可能不同:
- 当单位矩阵在右侧时(AIn),其维度 n 必须与矩阵 A 的列数相匹配。
- 当单位矩阵在左侧时(ImA),其维度 m 必须与矩阵 A 的行数相匹配。
理解乘法过程
我们通过一个具体的例子来理解为什么 AI=A。假设有一个 2×3 的矩阵 A:
A=(a11a21a12a22a13a23)
我们用 A 右乘一个 3×3 的单位矩阵 I3:
AI3=(a11a21a12a22a13a23)100010001
根据矩阵乘法的规则,结果矩阵的第 i 行第 j 列的元素,是 A 的第 i 行与 I3 的第 j 列的对应元素乘积之和:
- 计算结果矩阵的第一行第一列:(a11×1)+(a12×0)+(a13×0)=a11
- 计算结果矩阵的第一行第二列:(a11×0)+(a12×1)+(a13×0)=a12
- 计算结果矩阵的第一行第三列:(a11×0)+(a12×0)+(a13×1)=a13
以此类推,结果矩阵的每一项都恰好等于原始矩阵 A 的对应项:
AI3=(a11a21a12a22a13a23)=A
同理,可以用 I2A 来验证左乘的情况。
其他重要性质与应用
除了作为乘法单位元,单位矩阵还具有许多其他重要的数学性质。
- 行列式(Determinant):任何单位矩阵的行列式都等于 1。 \[ \det(I_n) = 1 \] 单位矩阵是一个上三角矩阵(也是下三角矩阵),其行列式等于主对角线上元素的乘积,即 1×1×⋯×1=1。
- 逆矩阵(Inverse Matrix):单位矩阵是它自身的逆矩阵。 \[ I^{-1} = I \] 这源于逆矩阵的定义 AA−1=I。将 A 替换为 I 得到 II−1=I,由于 I×B=B 对任何矩阵 B 都成立,因此 I−1 必须等于 I。
- 在求解逆矩阵中的作用:单位矩阵是求解逆矩阵过程中的核心工具。例如,在使用高斯--若尔当消元法(Gauss--Jordan Elimination)寻找矩阵 A 的逆 A−1 时,构造增广矩阵 [A∣I],然后通过一系列初等行操作(Elementary Row Operations)将左侧的 A 变换为单位矩阵 I。当左侧变为 I 时,右侧的矩阵就自动变成了 A−1: \[ [A \mid I] \xrightarrow{\text{行操作}} [I \mid A^{-1}] \]
- 线性变换(Linear Transformation):在几何上,单位矩阵代表恒等变换(Identity Transformation)。当用单位矩阵乘以一个向量时,该向量保持不变。这意味着它所代表的线性变换不会对向量空间中的任何向量产生旋转、缩放、反射或剪切等效果: \[ I \vec{v} = \vec{v} \]
- 特征值与特征向量(Eigenvalues and Eigenvectors):单位矩阵 In 的所有特征值都等于 1。因为对任何非零向量 v,都有 Iv=v=1⋅v,完全符合特征值方程 Av=λv 的定义。因此,n 维空间中任何非零向量都是单位矩阵对应于特征值 1 的特征向量。
形式化定义
单位矩阵的元素 (In)ij(即第 i 行第 j 列的元素)可以用克罗内克δ函数(Kronecker Delta)δij 来简洁地定义:
(In)ij=δij
其中,克罗内克 δ 函数定义为:
δij={10if i=jif i=j
这个定义精确地描述了单位矩阵对角线上为 1、其他位置为 0 的结构。