ARTICLE

正交

正交 (Orthogonality) 正交性 (Orthogonality) 是数学中一个源于几何学但被广泛推广的核心概念。在其最直观的形式中,它描述了两个向量是 互相垂直 的状态。然而,这个概念的强大之处在于它被抽象并应用于各种向量空间,包括无限维的函数空间。正交性是线性代数、泛函分析、统计学、信号处理和许多其他科学与工程领域的基础。 从根本上说,正交性允

浏览 60 更新 2025-10-14

正交 (Orthogonality)

正交性 (Orthogonality) 是数学中一个源于几何学但被广泛推广的核心概念。在其最直观的形式中,它描述了两个向量是 互相垂直 的状态。然而,这个概念的强大之处在于它被抽象并应用于各种向量空间,包括无限维的函数空间。正交性是线性代数泛函分析统计学、信号处理和许多其他科学与工程领域的基础。

从根本上说,正交性允许我们将复杂的问题分解为更简单、相互独立的组成部分。这种分解极大地简化了计算和理论分析。

几何直观与形式化定义

在二维或三维的欧几里得空间中,当两条直线或两个向量的夹角为 90 90^\circ 时,我们称它们是垂直的。这个概念是通过 内积 (Inner Product),也称为 点积 (Dot Product),来数学化的。

对于两个向量 v v w w ,它们之间的夹角 θ \theta 与其内积的关系由以下公式给出:

v,w=vwcos(θ)\langle v, w \rangle = \|v\| \|w\| \cos(\theta)

其中 v \|v\| w \|w\| 分别是向量 v v w w 的长度(或范数)。

从这个公式可以看出,要使夹角 θ=90 \theta = 90^\circ (即 cos(90)=0 \cos(90^\circ) = 0 ),当且仅当它们的内积为零。这个观察结果构成了正交性的形式化定义。

定义: 在一个内积空间 V V 中,如果两个向量 v,wV v, w \in V 的内积为零,即:

v,w=0\langle v, w \rangle = 0

则称向量 v v w w 正交的,记作 vw v \perp w

示例:在 R3 \mathbb{R}^3 考虑两个向量 v=(2,3,1) v = (2, 3, -1) w=(4,2,2) w = (4, -2, 2) 。它们在标准欧几里得空间中的内积(点积)是:

v,w=vw=(2)(4)+(3)(2)+(1)(2)=862=0\langle v, w \rangle = v \cdot w = (2)(4) + (3)(-2) + (-1)(2) = 8 - 6 - 2 = 0

由于内积为零,所以向量 v v w w 是正交的。

正交集与正交基

基于两个向量的正交关系,我们可以定义一组向量的性质。

  • 正交集 (Orthogonal Set):一个向量集合 {v1,v2,,vk} \{v_1, v_2, \dots, v_k\} ,如果其中任意两个 不同 的向量都是正交的,即对于所有 ij i \neq j ,都有 vi,vj=0 \langle v_i, v_j \rangle = 0
  • 标准正交集 (Orthonormal Set):一个正交集,并且其中每个向量的范数(长度)都为 1。即对于所有 i i , vi=vi,vi=1 \|v_i\| = \sqrt{\langle v_i, v_i \rangle} = 1

一个至关重要的属性是:一个由非零向量组成的正交集必然是线性无关的。 这使得正交集可以作为向量空间的基。

  • 正交基 (Orthogonal Basis):一个由正交向量组成的
  • 标准正交基 (Orthonormal Basis):一个由标准正交向量组成的基。

标准正交基在计算上极为方便。假设 {u1,u2,,un} \{\mathbf{u}_1, \mathbf{u}_2, \ldots, \mathbf{u}_n\} 是向量空间 V V 的一个标准正交基。那么空间中的任意向量 v v 都可以表示为这些基向量的线性组合:

v=c1u1+c2u2++cnunv = c_1 u_1 + c_2 u_2 + \dots + c_n u_n

这里的系数 ci c_i (即 v v 在基 ui u_i 上的坐标)的计算非常简单,不再需要解线性方程组,而可以直接通过内积得到:

ci=v,uic_i = \langle v, u_i \rangle

这个过程被称为 傅里叶展开 或在基上的投影。

若要将一个线性无关的基转换为一个标准正交基,可以使用一种名为 格拉姆-施密特正交化 (Gram-Schmidt Process) 的标准算法。

正交投影与子空间

正交性的概念可以从向量扩展到子空间

  • 正交补 (Orthogonal Complement):给定内积空间 V V 中的一个子空间 W W ,其正交补 W W^\perp (读作 "W perp") 是 V V 中所有与 W W 每一个 向量都正交的向量所组成的集合。形式化地:
W={vVv,w=0 for all wW}W^{\perp} = \{ v \in V \mid \langle v, w \rangle = 0 \text{ for all } w \in W \}

W W^\perp 本身也是 V V 的一个子空间。并且,整个空间 V V 可以被分解为 W W 和其正交补 W W^\perp 直和,记为 V=WW V = W \oplus W^\perp

  • 正交投影 (Orthogonal Projection):根据上述分解,任何向量 vV v \in V 都可以被唯一地写成两部分之和:
v=w+wv = w + w^\perp

其中 wW w \in W wW w^\perp \in W^\perp 。向量 w w 被称为 v v 在子空间 W W 上的 正交投影,记作 projW(v) \text{proj}_W(v)

正交投影有一个关键的最优化性质:projW(v) \text{proj}_W(v) 是子空间 W W 中与向量 v v "最接近"的向量。这一 最佳逼近定理 (Best Approximation Theorem)最小二乘法 (Least Squares Method) 的理论基础,该方法在数据拟合回归分析中被广泛应用。

推广与应用

正交性的概念被推广到数学和物理的许多分支中。

  • 正交函数 (Orthogonal Functions):我们可以定义一个函数空间(例如在区间 [a,b] [a,b] 上的所有连续函数)并为其配备一个内积,通常定义为:
f,g=abf(x)g(x)w(x)dx\langle f, g \rangle = \int_a^b f(x)g(x)w(x) \,dx

其中 w(x) w(x) 是一个非负的权函数。如果 f,g=0 \langle f, g \rangle = 0 ,则称函数 f f g g 在该内积定义下是正交的。

  • 傅里叶级数 (Fourier Series):这是正交函数最著名的应用。三角函数系 {sin(nx),cos(mx)} \{\sin(nx), \cos(mx)\} 在区间 [π,π] [-\pi, \pi] 上构成一个正交集。任何周期函数都可以被展开成这一系列正交函数的和,这在信号处理、声学和图像压缩中至关重要。
  • 正交多项式 (Orthogonal Polynomials):如勒让德多项式埃尔米特多项式等,它们在求解微分方程数值分析中扮演着重要角色。
  • 正交矩阵 (Orthogonal Matrix):在线性代数中,一个方阵 Q Q 如果其列向量(或行向量)构成一个标准正交集,则称其为正交矩阵。正交矩阵具有一个非常优美的性质:其逆矩阵等于其转置矩阵
QTQ=QQT=I    Q1=QTQ^T Q = Q Q^T = I \quad \implies \quad Q^{-1} = Q^T

从几何上看,正交矩阵对应的线性变换是保距变换(等距同构),它保持向量的长度和向量间的角度不变,例如旋转反射

  • 统计学中的应用
  • 统计学中,两个随机变量协方差为零时,称它们是 不相关的。如果这些变量的期望(均值)为零,那么不相关性在数学上等价于正交性。
  • 主成分分析 (Principal Component Analysis, PCA) 是一种降维技术,其核心思想就是寻找一个新的正交基(称为主成分),使得数据在这些新基上的分量是不相关的,从而可以用少数几个主成分来捕捉数据的大部分变异。
  • 线性回归中,残差向量被构造为与所有解释变量(自变量)所张成的子空间正交,这正是最小二乘估计的几何解释。

综上所述,正交性是连接几何直观与代数计算的桥梁,它通过提供一种标准化的分解方式,使得从向量、矩阵到函数和数据的各种复杂结构变得更加易于分析和处理。