知经 KNOWECON · 卓越的经济金融统计数学学习平台

单位矩阵

# 单位矩阵 (Identity Matrix)

单位矩阵 (Identity Matrix),在{{{线性代数}}}中通常记为 $I$ 或 $I_n$,是一个特殊的{{{方阵}}}。它的主要特征是其{{{主对角线}}}上的元素全部为 1,而所有非主对角线上的元素全部为 0。单位矩阵在{{{矩阵乘法}}}中的作用,类似于数字 1 在普通乘法中的作用,因此它也被称为乘法单位元 (Multiplicative Identity)。

一个 $n \times n$ 的单位矩阵 $I_n$ 可以表示为: $$ I_n = \begin{pmatrix} 1 & 0 & \cdots & 0 \\ 0 & 1 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & 1 \end{pmatrix} $$ 其中,下标 $n$ 表示这个方阵的{{{维度}}}(行数和列数)。在上下文清晰的情况下,下标 $n$ 常常被省略,直接用 $I$ 表示。

### 示例

* $I_1 = (1)$ * $I_2 = \begin{pmatrix} 1 & 0 \\ 0 & 1 \end{pmatrix}$ * $I_3 = \begin{pmatrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 1 \end{pmatrix}$ * $I_4 = \begin{pmatrix} 1 & 0 & 0 & 0 \\ 0 & 1 & 0 & 0 \\ 0 & 0 & 1 & 0 \\ 0 & 0 & 0 & 1 \end{pmatrix}$

## 核心性质:乘法单位元

单位矩阵最核心的性质是,任何{{{矩阵}}}与单位矩阵相乘(在维度允许的情况下),结果都等于其本身。这就像任何数字乘以 1 结果不变一样。

形式上,对于任意一个 $m \times n$ 的矩阵 $A$: $$ A I_n = A $$ $$ I_m A = A $$

重要提示:请注意在矩阵乘法中,左乘和右乘的单位矩阵维度可能不同。 * 当单位矩阵在右侧时 ($A I_n$),其维度 $n$ 必须与矩阵 $A$ 的列数相匹配。 * 当单位矩阵在左侧时 ($I_m A$),其维度 $m$ 必须与矩阵 $A$ 的行数相匹配。

### 理解乘法过程

我们通过一个具体的例子来理解为什么 $A I = A$。假设有一个 $2 \times 3$ 的矩阵 $A$: $$ A = \begin{pmatrix} a_{11} & a_{12} & a_{13} \\ a_{21} & a_{22} & a_{23} \end{pmatrix} $$ 我们用 $A$ 右乘一个 $3 \times 3$ 的单位矩阵 $I_3$: $$ A I_3 = \begin{pmatrix} a_{11} & a_{12} & a_{13} \\ a_{21} & a_{22} & a_{23} \end{pmatrix} \begin{pmatrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 1 \end{pmatrix} $$ 根据{{{矩阵乘法}}}的规则,结果矩阵的第 $i$ 行第 $j$ 列的元素,是 $A$ 的第 $i$ 行与 $I_3$ 的第 $j$ 列的对应元素乘积之和。

* 计算结果矩阵的第一行第一列: $(a_{11} \times 1) + (a_{12} \times 0) + (a_{13} \times 0) = a_{11}$ * 计算结果矩阵的第一行第二列: $(a_{11} \times 0) + (a_{12} \times 1) + (a_{13} \times 0) = a_{12}$ * 计算结果矩阵的第一行第三列: $(a_{11} \times 0) + (a_{12} \times 0) + (a_{13} \times 1) = a_{13}$

以此类推,我们会发现结果矩阵的每一项都恰好等于原始矩阵 $A$ 的对应项。 $$ A I_3 = \begin{pmatrix} a_{11} & a_{12} & a_{13} \\ a_{21} & a_{22} & a_{23} \end{pmatrix} = A $$ 同理,可以用 $I_2 A$ 来验证左乘的情况。

## 其他重要性质与应用

除了作为乘法单位元,单位矩阵还具有许多其他重要的数学性质。

1. {{{行列式}}} (Determinant) 任何单位矩阵的行列式都等于 1。 $$ \det(I_n) = 1 $$ 这很容易理解,因为单位矩阵是一个上三角矩阵(也是下三角矩阵),其行列式等于主对角线上元素的乘积,即 $1 \times 1 \times \cdots \times 1 = 1$。

2. {{{逆矩阵}}} (Inverse Matrix) 单位矩阵是它自身的逆矩阵。 $$ I^{-1} = I $$ 这源于逆矩阵的定义 $A A^{-1} = I$。将 $A$ 替换为 $I$,我们得到 $I I^{-1} = I$。由于 $I \times B = B$ 对于任何矩阵 $B$ 都成立,因此 $I^{-1}$ 必须等于 $I$。

3. 在求解逆矩阵中的作用 单位矩阵是求解{{{逆矩阵}}}过程中的核心工具。例如,在使用高斯-若尔当消元法 (Gauss-Jordan Elimination) 寻找矩阵 $A$ 的逆 $A^{-1}$ 时,我们会构造一个增广矩阵 $[A | I]$。然后,通过一系列的初等{{{行操作}}} (Elementary Row Operations),将左侧的 $A$ 矩阵变换为单位矩阵 $I$。当左侧变为 $I$ 时,右侧的矩阵就自动变成了 $A^{-1}$。 $$ [A | I] \xrightarrow{\text{行操作}} [I | A^{-1}] $$

4. {{{线性变换}}} (Linear Transformation) 在几何上,单位矩阵代表恒等变换 (Identity Transformation)。当用单位矩阵乘以一个{{{向量}}}时,该向量保持不变。这意味着它所代表的线性变换不会对{{{向量空间}}}中的任何向量产生旋转、缩放、反射或剪切等效果。 $$ I \vec{v} = \vec{v} $$

5. {{{特征值}}}与{{{特征向量}}} (Eigenvalues and Eigenvectors) 单位矩阵 $I_n$ 的所有{{{特征值}}}都等于 1。这是因为对于任何非零向量 $\vec{v}$,都有 $I\vec{v} = \vec{v} = 1 \cdot \vec{v}$,这完全符合特征值方程 $A\vec{v} = \lambda\vec{v}$ 的定义,其中特征值 $\lambda = 1$。因此,对于单位矩阵,$n$ 维空间中任何非零向量都是其对应于特征值 1 的{{{特征向量}}}。

## 形式化定义

单位矩阵的元素 $(I_n)_{ij}$(即第 $i$ 行第 $j$ 列的元素)可以用{{{克罗内克δ函数}}} (Kronecker Delta) $\delta_{ij}$ 来简洁地定义: $$ (I_n)_{ij} = \delta_{ij} $$ 其中,克罗内克δ函数的定义为: $$ \delta_{ij} = \begin{cases} 1 & \text{if } i=j \\ 0 & \text{if } i \neq j \end{cases} $$ 这个定义精确地描述了单位矩阵对角线上为 1,其他位置为 0 的结构。