子空间 (Subspace)
子空间 是线性代数 中的核心概念,指一个向量空间的非空子集,其自身在相同的加法和标量乘法运算下也构成向量空间。子空间为理解线性系统的解结构、投影理论和降维方法提供了基本框架,在计量经济学 、统计学 和机器学习 中具有广泛而深刻的应用。
定义与充要条件
设 V V V 是域 F \mathbb{F} F (通常为 R \mathbb{R} R 或 C \mathbb{C} C )上的向量空间。非空子集 W ⊆ V W \subseteq V W ⊆ V 是 V V V 的子空间,当且仅当关于加法和标量乘法封闭:
加法封闭 :对任意 u , v ∈ W \mathbf{u}, \mathbf{v} \in W u , v ∈ W ,有 u + v ∈ W \mathbf{u} + \mathbf{v} \in W u + v ∈ W ;标量乘法封闭 :对任意 u ∈ W \mathbf{u} \in W u ∈ W 和标量 c ∈ F c \in \mathbb{F} c ∈ F ,有 c u ∈ W c\mathbf{u} \in W c u ∈ W 。
两个条件可合并为单一判定条件:对任意 u , v ∈ W \mathbf{u}, \mathbf{v} \in W u , v ∈ W 和 a , b ∈ F a, b \in \mathbb{F} a , b ∈ F ,有 a u + b v ∈ W a\mathbf{u} + b\mathbf{v} \in W a u + b v ∈ W 。任一子空间必然包含零向量 0 \mathbf{0} 0 ,因为取 c = 0 c = 0 c = 0 即可由封闭性推出。换言之,不含零向量的子集不可能是子空间。
常见子空间
在 R n \mathbb{R}^n R n 中,以下几种子空间尤为重要:
零空间 (Null Space) :对 m × n m \times n m × n 矩阵 A \mathbf{A} A ,其零空间 N ( A ) = { x ∈ R n : A x = 0 } \mathcal{N}(\mathbf{A}) = \{\mathbf{x} \in \mathbb{R}^n : \mathbf{A}\mathbf{x} = \mathbf{0}\} N ( A ) = { x ∈ R n : Ax = 0 } 是 R n \mathbb{R}^n R n 的子空间。零空间刻画了齐次线性方程组的所有解。在线性回归中,若设计矩阵的零空间非平凡(仅含 0 \mathbf{0} 0 ),则存在完全共线性,OLS 估计量不唯一。列空间 (Column Space) :矩阵 A \mathbf{A} A 的列空间 C ( A ) = { A x : x ∈ R n } \mathcal{C}(\mathbf{A}) = \{\mathbf{A}\mathbf{x} : \mathbf{x} \in \mathbb{R}^n\} C ( A ) = { Ax : x ∈ R n } 是 R m \mathbb{R}^m R m 的子空间,由 A \mathbf{A} A 所有列向量的线性组合张成。在回归模型中,列空间是 y ^ = X β ^ \hat{\mathbf{y}} = \mathbf{X}\hat{\boldsymbol{\beta}} y ^ = X β ^ 所在的空间——所有可能的拟合值恰好构成设计矩阵 X \mathbf{X} X 的列空间。行空间 (Row Space) :A \mathbf{A} A 的行空间 R ( A ) = C ( A ⊤ ) \mathcal{R}(\mathbf{A}) = \mathcal{C}(\mathbf{A}^\top) R ( A ) = C ( A ⊤ ) 是 R n \mathbb{R}^n R n 的子空间。行空间与零空间互为正交补:R ( A ) ⊕ N ( A ) = R n \mathcal{R}(\mathbf{A}) \oplus \mathcal{N}(\mathbf{A}) = \mathbb{R}^n R ( A ) ⊕ N ( A ) = R n ,即秩-零化度定理 的几何表述。张成空间 (Span) :给定向量组 { v 1 , … , v k } ⊆ V \{\mathbf{v}_1, \ldots, \mathbf{v}_k\} \subseteq V { v 1 , … , v k } ⊆ V ,其张成空间 span { v 1 , … , v k } \operatorname{span}\{\mathbf{v}_1, \ldots, \mathbf{v}_k\} span { v 1 , … , v k } 是所有线性组合的集合,是包含这些向量的最小子空间。
基本子空间定理与正交分解
线性代数的基本定理 指出,对任意 m × n m \times n m × n 矩阵 A \mathbf{A} A :
R n = R ( A ) ⊕ N ( A ) , R m = C ( A ) ⊕ N ( A ⊤ ) \mathbb{R}^n = \mathcal{R}(\mathbf{A}) \oplus \mathcal{N}(\mathbf{A}), \quad \mathbb{R}^m = \mathcal{C}(\mathbf{A}) \oplus \mathcal{N}(\mathbf{A}^\top) R n = R ( A ) ⊕ N ( A ) , R m = C ( A ) ⊕ N ( A ⊤ )
其中 ⊕ \oplus ⊕ 表示正交直和。这意味着任何 x ∈ R n \mathbf{x} \in \mathbb{R}^n x ∈ R n 可唯一分解为行空间分量与零空间分量之和。该分解在计量经济学中对应着Frisch-Waugh-Lovell定理 和偏回归的几何直觉——控制一组变量等价于在被控变量的正交补子空间上做投影。
计量经济学中的核心应用
子空间理论渗透在计量经济学的多个层面:
OLS 的几何解释 :OLS 估计量 β ^ \hat{\boldsymbol{\beta}} β ^ 使得残差向量 ε ^ = y − X β ^ \hat{\boldsymbol{\varepsilon}} = \mathbf{y} - \mathbf{X}\hat{\boldsymbol{\beta}} ε ^ = y − X β ^ 正交于设计矩阵的列空间 C ( X ) \mathcal{C}(\mathbf{X}) C ( X ) 。换言之,拟合值 y ^ = X β ^ \hat{\mathbf{y}} = \mathbf{X}\hat{\boldsymbol{\beta}} y ^ = X β ^ 是 y \mathbf{y} y 在 C ( X ) \mathcal{C}(\mathbf{X}) C ( X ) 上的正交投影,投影矩阵为 P X = X ( X ⊤ X ) − 1 X ⊤ \mathbf{P}_{\mathbf{X}} = \mathbf{X}(\mathbf{X}^\top\mathbf{X})^{-1}\mathbf{X}^\top P X = X ( X ⊤ X ) − 1 X ⊤ 。残差制造矩阵 M X = I − P X \mathbf{M}_{\mathbf{X}} = \mathbf{I} - \mathbf{P}_{\mathbf{X}} M X = I − P X 则将 y \mathbf{y} y 投影到 C ( X ) \mathcal{C}(\mathbf{X}) C ( X ) 的正交补 N ( X ⊤ ) \mathcal{N}(\mathbf{X}^\top) N ( X ⊤ ) 上。方差分析分解 :总平方和 y ⊤ y \mathbf{y}^\top\mathbf{y} y ⊤ y 可分解为模型平方和 y ⊤ P X y \mathbf{y}^\top\mathbf{P}_{\mathbf{X}}\mathbf{y} y ⊤ P X y 与残差平方和 y ⊤ M X y \mathbf{y}^\top\mathbf{M}_{\mathbf{X}}\mathbf{y} y ⊤ M X y 。此分解的正交性由 P X M X = 0 \mathbf{P}_{\mathbf{X}}\mathbf{M}_{\mathbf{X}} = \mathbf{0} P X M X = 0 保证,本质上是 R n \mathbb{R}^n R n 在 C ( X ) \mathcal{C}(\mathbf{X}) C ( X ) 和 N ( X ⊤ ) \mathcal{N}(\mathbf{X}^\top) N ( X ⊤ ) 两个互为正交补的子空间上的直和分解。完全共线性检测 :当设计矩阵 X \mathbf{X} X 的列不满秩时,N ( X ) \mathcal{N}(\mathbf{X}) N ( X ) 的维数(即零化度)大于零,存在非零向量 c \mathbf{c} c 使 X c = 0 \mathbf{X}\mathbf{c} = \mathbf{0} Xc = 0 ——这就是完全共线性的代数本质。此时 X ⊤ X \mathbf{X}^\top\mathbf{X} X ⊤ X 不可逆,OLS 没有唯一解,需借助广义逆矩阵 或岭回归 等正则化手段。主成分分析 (PCA) :PCA 寻找数据协方差矩阵的特征子空间——数据变异最大的方向所张成的低维子空间。通过将高维数据投影到前 k k k 个主成分子空间上,实现降维并保留最大方差。这在因子模型 、扩散指数 预测和宏观经济 预测中广泛应用。工具变量法 :两阶段最小二乘法 (2SLS) 的第一阶段将内生解释变量投影到工具变量的列空间 C ( Z ) \mathcal{C}(\mathbf{Z}) C ( Z ) 上,第二阶段则在投影后的变量所张成的子空间中进行回归,从而消除内生性偏误。
与相关概念的区分
子空间与仿射空间 不同:仿射空间是子空间的平移(如 { x : A x = b } \{\mathbf{x} : \mathbf{A}\mathbf{x} = \mathbf{b}\} { x : Ax = b } 当 b ≠ 0 \mathbf{b} \neq \mathbf{0} b = 0 时是仿射空间而非子空间)。与凸集 的关系:子空间必然是凸集(线性组合对任意系数封闭),但凸集未必是子空间。
在度量空间 和拓扑空间 的语境中,子空间一词也指赋范向量空间或内积空间的子集配备诱导度量和相对拓扑。有限维赋范向量空间的任一子空间都是完备的(即Banach空间 的闭子空间),但无穷维情况下子空间可能不闭——这在函数空间 和非参数计量经济学中的筛分估计 (sieve estimation) 中是一关键技术细节:筛分空间通常是随着样本量增大而逐渐扩张的有限维子空间序列。
关于知经 KNOWECON
知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌,长期面向北京大学、清华大学、中国人民大学等顶尖院校,提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考,并成功进入理想院校。
知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业,获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者,长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。
我们相信,好的考研辅导不只是押题和陪跑,更是把复杂知识讲清楚、把复习路径设计清楚,并用技术让学习过程更可追踪、更可反馈、更可坚持。