基 (Basis)
在线性代数 中,一个向量空间 V V V 的基 (Basis) 是一个由向量组成的集合 B = { v 1 , v 2 , … , v n } B = \{\mathbf{v}_1, \mathbf{v}_2, \dots, \mathbf{v}_n\} B = { v 1 , v 2 , … , v n } ,这个集合中的向量需要满足两个关键条件:它们是线性无关 的,并且它们可以生成 (span) 整个向量空间 V V V 。
从概念上讲,基为向量空间提供了一个"坐标系"。一旦我们为向量空间选定了一组基,空间中的任何一个向量都可以用这组基向量的线性组合 来唯一地表示。这种表示形式中的系数,就被称为该向量在这组基下的坐标 (Coordinates)。基的概念是连接抽象的向量空间与具体的数值表示之间的桥梁,没有基,向量空间只是一个缺乏计算工具的结构。
形式化定义
一个向量空间 V V V 的子集 B ⊆ V B \subseteq V B ⊆ V 被称为 V V V 的一个基,如果它满足以下两个条件:
线性无关 (Linear Independence):集合 B B B 中的向量是线性无关的。这意味着,对于集合中任意有限个不同的向量 { v 1 , v 2 , … , v k } ⊆ B \{\mathbf{v}_1, \mathbf{v}_2, \dots, \mathbf{v}_k\} \subseteq B { v 1 , v 2 , … , v k } ⊆ B ,唯一能够使得方程
c 1 v 1 + c 2 v 2 + ⋯ + c k v k = 0 c_1\mathbf{v}_1 + c_2\mathbf{v}_2 + \dots + c_k\mathbf{v}_k = \mathbf{0} c 1 v 1 + c 2 v 2 + ⋯ + c k v k = 0
成立的标量系数解是 c 1 = c 2 = ⋯ = c k = 0 c_1 = c_2 = \dots = c_k = 0 c 1 = c 2 = ⋯ = c k = 0 。换句话说,基集合中的任何一个向量都不能被表示为其他基向量的线性组合。这保证了基集合中没有"冗余"的向量。
生成空间 (Spanning Set):集合 B B B 是 V V V 的一个生成集。这意味着,对于向量空间 V V V 中的任意一个向量 v \mathbf{v} v ,它都可以被表示为 B B B 中向量的(有限)线性组合。即,存在一组标量 c 1 , c 2 , … , c n c_1, c_2, \dots, c_n c 1 , c 2 , … , c n 和基向量 v 1 , v 2 , … , v n ∈ B \mathbf{v}_1, \mathbf{v}_2, \dots, \mathbf{v}_n \in B v 1 , v 2 , … , v n ∈ B ,使得:
v = c 1 v 1 + c 2 v 2 + ⋯ + c n v n \mathbf{v} = c_1\mathbf{v}_1 + c_2\mathbf{v}_2 + \dots + c_n\mathbf{v}_n v = c 1 v 1 + c 2 v 2 + ⋯ + c n v n
这个条件保证了基集合足以"覆盖"或"构建"出整个向量空间中的每一个向量。
结合这两个条件,基是一个"最小的生成集",也是一个"最大的线性无关集"。任何不是基的生成集都可以缩小到基的大小,任何线性无关集都可以扩充为基。
常见示例
笛卡尔坐标系的标准基
最常见和直观的基是欧几里得空间 R n \mathbb{R}^n R n 中的标准基 (Standard Basis),也称为自然基 (Natural Basis)。
在二维空间 R 2 \mathbb{R}^2 R 2 (即平面)中,标准基是 B = { e 1 , e 2 } B = \{\mathbf{e}_1, \mathbf{e}_2\} B = { e 1 , e 2 } ,其中:
e 1 = ( 1 0 ) , e 2 = ( 0 1 ) \mathbf{e}_1 = \begin{pmatrix} 1 \\ 0 \end{pmatrix}, \quad \mathbf{e}_2 = \begin{pmatrix} 0 \\ 1 \end{pmatrix} e 1 = ( 1 0 ) , e 2 = ( 0 1 )
平面上的任意一个向量 v = ( a b ) \mathbf{v} = \begin{pmatrix} a \\ b \end{pmatrix} v = ( a b ) 都可以唯一地写成 v = a e 1 + b e 2 \mathbf{v} = a\mathbf{e}_1 + b\mathbf{e}_2 v = a e 1 + b e 2 。这里的 ( a , b ) (a, b) ( a , b ) 就是向量 v \mathbf{v} v 在标准基下的坐标。
在三维空间 R 3 \mathbb{R}^3 R 3 中,标准基是 B = { e 1 , e 2 , e 3 } B = \{\mathbf{e}_1, \mathbf{e}_2, \mathbf{e}_3\} B = { e 1 , e 2 , e 3 } ,其中:
e 1 = ( 1 0 0 ) , e 2 = ( 0 1 0 ) , e 3 = ( 0 0 1 ) \mathbf{e}_1 = \begin{pmatrix} 1 \\ 0 \\ 0 \end{pmatrix}, \quad \mathbf{e}_2 = \begin{pmatrix} 0 \\ 1 \\ 0 \end{pmatrix}, \quad \mathbf{e}_3 = \begin{pmatrix} 0 \\ 0 \\ 1 \end{pmatrix} e 1 = 1 0 0 , e 2 = 0 1 0 , e 3 = 0 0 1
R 2 \mathbb{R}^2 R 2 的非标准基
一个向量空间通常有无穷多组不同的基。例如,对于 R 2 \mathbb{R}^2 R 2 ,集合 B ′ = { v 1 , v 2 } B' = \{\mathbf{v}_1, \mathbf{v}_2\} B ′ = { v 1 , v 2 } 也是一组基,其中:
v 1 = ( 1 1 ) , v 2 = ( 1 − 1 ) \mathbf{v}_1 = \begin{pmatrix} 1 \\ 1 \end{pmatrix}, \quad \mathbf{v}_2 = \begin{pmatrix} 1 \\ -1 \end{pmatrix} v 1 = ( 1 1 ) , v 2 = ( 1 − 1 )
我们可以验证它满足两个条件:
线性无关:方程 c 1 ( 1 1 ) + c 2 ( 1 − 1 ) = ( 0 0 ) c_1\begin{pmatrix} 1 \\ 1 \end{pmatrix} + c_2\begin{pmatrix} 1 \\ -1 \end{pmatrix} = \begin{pmatrix} 0 \\ 0 \end{pmatrix} c 1 ( 1 1 ) + c 2 ( 1 − 1 ) = ( 0 0 ) 意味着 c 1 + c 2 = 0 c_1+c_2=0 c 1 + c 2 = 0 和 c 1 − c 2 = 0 c_1-c_2=0 c 1 − c 2 = 0 ,解得唯一的解是 c 1 = 0 , c 2 = 0 c_1=0, c_2=0 c 1 = 0 , c 2 = 0 。
生成空间:对于任意向量 ( x y ) ∈ R 2 \begin{pmatrix} x \\ y \end{pmatrix} \in \mathbb{R}^2 ( x y ) ∈ R 2 ,我们总能找到系数 c 1 , c 2 c_1, c_2 c 1 , c 2 使其成立。通过求解方程组,我们得到 c 1 = x + y 2 c_1 = \frac{x+y}{2} c 1 = 2 x + y 和 c 2 = x − y 2 c_2 = \frac{x-y}{2} c 2 = 2 x − y 。
例如,向量 u = ( 3 5 ) \mathbf{u} = \begin{pmatrix} 3 \\ 5 \end{pmatrix} u = ( 3 5 ) 在标准基下的坐标是 ( 3 , 5 ) (3, 5) ( 3 , 5 ) 。但在基 B ′ B' B ′ 下,它的坐标是 c 1 = 3 + 5 2 = 4 c_1 = \frac{3+5}{2} = 4 c 1 = 2 3 + 5 = 4 和 c 2 = 3 − 5 2 = − 1 c_2 = \frac{3-5}{2} = -1 c 2 = 2 3 − 5 = − 1 。因此,u = 4 v 1 − v 2 \mathbf{u} = 4\mathbf{v}_1 - \mathbf{v}_2 u = 4 v 1 − v 2 。
向量空间的概念不仅限于几何向量。考虑所有次数不超过2的实系数多项式构成的空间,记为 P 2 ( R ) P_2(\mathbb{R}) P 2 ( R ) 。这个空间的一个标准基是:
B = { 1 , x , x 2 } B = \{1, x, x^2\} B = { 1 , x , x 2 }
空间中的任何一个多项式,如 p ( x ) = a 0 + a 1 x + a 2 x 2 p(x) = a_0 + a_1x + a_2x^2 p ( x ) = a 0 + a 1 x + a 2 x 2 ,都可以看作是这组基向量的线性组合,其坐标为 ( a 0 , a 1 , a 2 ) (a_0, a_1, a_2) ( a 0 , a 1 , a 2 ) 。
核心性质与定理
表示的唯一性 (Uniqueness of Representation):对于一个给定的基 B B B ,向量空间 V V V 中的每一个向量 v \mathbf{v} v 都可以被唯一地 表示为基向量的线性组合。这是基最重要的特性之一,它使得坐标的概念得以成立。如果存在两种表示方式,通过简单的代数运算和利用基的线性无关性,可以证明这两种表示的系数必须完全相同。
维度 (Dimension):一个非常深刻的定理指出:对于一个给定的有限维向量空间 ,其所有基都包含相同数量的向量 。这个不变的数值被称为该向量空间的维度 。例如,R 2 \mathbb{R}^2 R 2 的维度是 2,因为它的所有基(无论是标准基还是非标准基)都含有2个向量;P 2 ( R ) P_2(\mathbb{R}) P 2 ( R ) 的维度是 3,因为它的标准基含有3个元素。如果一个向量空间的基包含无限个向量,则称该空间为无限维向量空间 。
基的存在性 (Existence of a Basis):除了只包含零向量的平凡向量空间外,任何一个向量空间都存在一组基。对于无限维空间,这个结论的证明依赖于集合论中的选择公理 。基的存在性保证了任何向量空间都有至少一个"坐标系",这是后续所有线性代数运算的基础。
基变换
由于同一向量在不同基下有不同的坐标,因此在不同基之间转换坐标是一个核心问题。这个转换过程通过一个称为基变换矩阵 (Transition Matrix / Change-of-Basis Matrix) 的特殊矩阵 来完成。
假设空间 V V V 有两组基,B = { u 1 , … , u n } B = \{\mathbf{u}_1, \dots, \mathbf{u}_n\} B = { u 1 , … , u n } 和 C = { w 1 , … , w n } C = \{\mathbf{w}_1, \dots, \mathbf{w}_n\} C = { w 1 , … , w n } 。任何一个向量 x ∈ V \mathbf{x} \in V x ∈ V 在这两组基下有不同的坐标表示,记为 [ x ] B [\mathbf{x}]_B [ x ] B 和 [ x ] C [\mathbf{x}]_C [ x ] C 。基变换矩阵 P C ← B P_{C \leftarrow B} P C ← B 可以将一个向量从基 B B B 的坐标转换到基 C C C 的坐标:
[ x ] C = P C ← B [ x ] B [\mathbf{x}]_C = P_{C \leftarrow B} [\mathbf{x}]_B [ x ] C = P C ← B [ x ] B
该矩阵的第 j j j 列是由基 B B B 中的第 j j j 个向量 u j \mathbf{u}_j u j 在基 C C C 下的坐标向量 [ u j ] C [\mathbf{u}_j]_C [ u j ] C 构成的。基变换矩阵一定是可逆的,其逆矩阵 P B ← C = P C ← B − 1 P_{B \leftarrow C} = P_{C \leftarrow B}^{-1} P B ← C = P C ← B − 1 实现了反向的坐标转换。
应用
基是线性代数乃至整个数学的基石概念,其应用无处不在:
线性变换 的矩阵表示 :任何一个线性变换 都可以通过它作用于基向量上的效果来完全确定。选择不同的基(特别是特征向量 组成的基),可以得到该变换的更简洁的矩阵表示(如对角矩阵 )。这一原理是谱定理 和奇异值分解 (SVD) 等关键定理的基础。
数据压缩与降维 :在机器学习 和信号处理 中,像主成分分析 (PCA) 这样的技术,其本质就是寻找一组新的基,使得数据在这组基上的表示能够最大化地保留信息,从而可以用更少的基向量来近似原始数据。压缩感知 (Compressed Sensing) 则利用信号在某种基下的稀疏性,以远低于奈奎斯特采样定理 要求的采样频率重构完整信号。
函数空间分析 :在泛函分析 中,函数的概念被推广。例如,傅里叶级数 就是将周期函数表示为一组正弦和余弦函数(一组正交基)的线性组合。小波分析 则使用另一类函数基(小波基)来分析信号。这些方法在图像处理 和音频压缩 中具有核心作用。
计算机图形学 :物体的旋转、缩放、平移等变换都是通过改变其顶点在特定坐标系(基)下的坐标来完成的。场景中的不同物体可能使用不同的局部坐标系,它们之间的转换就是基变换。GPU 的并行架构特别适合执行大规模的矩阵和基变换运算。