ARTICLE

超平面

超平面 (Hyperplane) 超平面是线性代数、凸分析和几何学中最基本的概念之一。直观地说,在 n 维空间 R^n 中,一个超平面是一个 n-1 维的平坦子空间。它是直线的自然推广——在二维空间中超平面就是直线,在三维空间中超平面就是平面,在更高维空间中则是"平坦"的 n-1 维仿射集合。超平面在最优化、支持向量机、一般均衡理论和线性规划中都具有核心地位

浏览 0 更新 2025-12-18

超平面 (Hyperplane)

超平面是线性代数、凸分析和几何学中最基本的概念之一。直观地说,在 nn 维空间 Rn\mathbb{R}^n 中,一个超平面是一个 n1n-1 维的平坦子空间。它是直线的自然推广——在二维空间中超平面就是直线,在三维空间中超平面就是平面,在更高维空间中则是"平坦"的 n1n-1 维仿射集合。超平面在最优化支持向量机、一般均衡理论和线性规划中都具有核心地位。

定义与基本表示

给定一个非零向量 wRn\mathbf{w} \in \mathbb{R}^n 和一个标量 bRb \in \mathbb{R},超平面 H\mathcal{H} 定义为所有满足以下线性方程的点的集合:

H={xRnwx+b=0}\mathcal{H} = \{\mathbf{x} \in \mathbb{R}^n \mid \mathbf{w} \cdot \mathbf{x} + b = 0 \}

等价地,也可以写作 ax=c\mathbf{a}^\top \mathbf{x} = c 的形式,其中 a=w\mathbf{a} = -\mathbf{w}c=bc = b。向量 w\mathbf{w} 称为超平面的法向量 (Normal Vector),它垂直于超平面上任意两个点之差所张成的方向。标量 bb 决定了超平面相对于原点的偏移量:当 b=0b = 0 时,超平面经过原点,此时它是一个真子空间;当 b0b \neq 0 时,超平面是一个仿射子空间。

半空间与分离性质

超平面将其所在的 nn 维空间分割为两个闭半空间 (Closed Half-Spaces)

H+={xwx+b0},H={xwx+b0}\mathcal{H}^+ = \{\mathbf{x} \mid \mathbf{w} \cdot \mathbf{x} + b \geq 0\}, \quad \mathcal{H}^- = \{\mathbf{x} \mid \mathbf{w} \cdot \mathbf{x} + b \leq 0\}

以及对应的开半空间(将不等号改为严格不等)。这一分割性质是超平面最核心的功能:它能够将空间中的点划分为两个互斥且穷尽的区域,从而天然地成为二分类问题的几何工具。

点到超平面的距离

空间中任意一点 x0\mathbf{x}_0 到超平面 H\mathcal{H} 的欧氏距离由下式给出:

d(x0,H)=wx0+bwd(\mathbf{x}_0, \mathcal{H}) = \frac{|\mathbf{w} \cdot \mathbf{x}_0 + b|}{\|\mathbf{w}\|}

其中 w=ww\|\mathbf{w}\| = \sqrt{\mathbf{w} \cdot \mathbf{w}} 是法向量的欧几里得范数。该公式的几何意义十分清晰:分子 wx0+b|\mathbf{w} \cdot \mathbf{x}_0 + b| 度量了点 x0\mathbf{x}_0 偏离超平面的"代数距离"(未归一化),而分母 w\|\mathbf{w}\| 提供了归一化因子。特别地,原点 0\mathbf{0} 到超平面的距离为 b/w|b|/\|\mathbf{w}\|

若对法向量进行单位化(即令 w=1\|\mathbf{w}\| = 1),则 wx+b\mathbf{w} \cdot \mathbf{x} + b 直接给出了带符号的垂直距离,符号指示点位于超平面的哪一侧。

支撑超平面与分离超平面定理

超平面的理论力量集中体现在凸分析的两个核心定理中:

支撑超平面定理 (Supporting Hyperplane Theorem):CRnC \subset \mathbb{R}^n 是一个非空闭凸集,x0\mathbf{x}_0CC 的边界点。则存在一个超平面经过 x0\mathbf{x}_0,使整个集合 CC 完全落在该超平面的同一侧。满足这一性质的超平面称为 CCx0\mathbf{x}_0 处的支撑超平面

分离超平面定理 (Separating Hyperplane Theorem):AABBRn\mathbb{R}^n 中两个互不相交的非空凸集,则存在一个超平面将它们严格分离,即 AA 完全位于一个开半空间内,BB 完全位于另一个开半空间内。该定理是凸优化中KKT条件的理论基础之一。

在经济学中的应用

超平面在经济学中有着深远且多样的应用:

  1. 预算约束:在 nn 种商品的消费空间中,消费者面临的预算线(二维)或预算超平面(高维)由 px=m\mathbf{p} \cdot \mathbf{x} = m 定义,其中 p\mathbf{p} 为价格向量,mm 为收入。该超平面将消费集划分为"可负担"和"不可负担"两个区域。
  2. 分离价格与福利经济学第二定理一般均衡理论中,阿罗-德布鲁模型的竞争均衡与帕累托最优之间的对应关系,本质上是分离超平面定理在无穷维商品空间中的深刻应用。福利经济学第二定理断言,任意帕累托最优配置都可以在适当的禀赋再分配后由竞争市场实现——其证明的核心正是在帕累托最优配置点的支撑超平面上,取法向量作为价格向量。
  3. 等产量线与等成本线:在生产理论中,等产量线等成本线作为二维超平面(即直线),其相切条件——边际技术替代率等于要素价格比——决定了企业的成本最小化投入组合。
  4. 资产定价中的随机贴现因子:在CAPM和随机贴现因子框架中,资产价格等于未来支付的贴现期望值,这一定价公式在几何上可以理解为:价格就是贴现支付在状态空间超平面上的投影。

在统计学与机器学习中的应用

超平面在现代统计学和机器学习中扮演着关键角色:

支持向量机 (SVM): SVM的核心目标是寻找一个最优分离超平面,使两类样本之间的间隔 (Margin)最大化。对于线性可分的训练数据 {(xi,yi)}i=1n,yi{1,+1}\{(x_i, y_i)\}_{i=1}^n, \, y_i \in \{-1, +1\},数学形式为:

minw,b12w2s.t.yi(wxi+b)1,  i\min_{\mathbf{w}, b} \frac{1}{2}\|\mathbf{w}\|^2 \quad \text{s.t.} \quad y_i(\mathbf{w} \cdot x_i + b) \geq 1, \; \forall i

约束条件保证了每个样本点到超平面的带符号距离至少为 1/w1/\|\mathbf{w}\|,而最大化间隔 2/w2/\|\mathbf{w}\| 等价于最小化 w2\|\mathbf{w}\|^2。当数据线性不可分时,通过核方法将数据映射到高维特征空间,再在高维空间中构造分离超平面。

线性判别分析 (LDA): LDA通过最大化类间方差与类内方差之比来寻找最优投影超平面,本质上也是在特征空间中构造一个分类超平面。

线性回归的几何视角: OLS回归中,拟合值 y^=X(XX)1Xy\hat{\mathbf{y}} = \mathbf{X}(\mathbf{X}^\top\mathbf{X})^{-1}\mathbf{X}^\top\mathbf{y}y\mathbf{y}X\mathbf{X} 的列空间上的正交投影。残差向量 ε^=yy^\hat{\boldsymbol{\varepsilon}} = \mathbf{y} - \hat{\mathbf{y}} 与该列空间正交——这种正交性正是通过超平面概念来刻画的。

与其它数学概念的关系

  • 凸集:超平面本身是一个凸集(实际上是一个仿射空间),而半空间同样是凸集。凸集可以表示为包含它的所有半空间的交集,这是凸集表示理论的基本事实。
  • 线性规划:线性规划的标准形式中,约束条件 Axb\mathbf{A}\mathbf{x} \leq \mathbf{b} 定义了若干半空间的交集——即一个多面体 (Polyhedron)。目标函数 cx\mathbf{c}^\top\mathbf{x} 的等值面是一族平行的超平面,最优解必位于可行域边界的某处。
  • KKT条件:在有约束最优化中,KKT 条件要求在最优解处,目标函数的梯度可以表示为各约束梯度的非负线性组合——这在几何上等价于在最优解处存在一个支撑超平面分离目标函数的下降方向与可行方向锥。
  • 仿射函数 (Affine Function):超平面的定义方程 wx+b=0\mathbf{w} \cdot \mathbf{x} + b = 0 的左端正是仿射函数的标准形式。超平面本质上是仿射函数的零水平集。

总之,超平面不仅仅是高维空间中的"一块平板"——它是一把解剖空间的利刃,将复杂的几何结构一分为二,同时又作为凸分析、优化理论和经济学模型的基础构件,贯穿于从纯数学到应用科学的众多领域。理解超平面的性质,是深入掌握凸优化、计量方法乃至现代微观经济理论的必要前提。