ARTICLE
斜投影
斜投影 (Oblique Projection) 斜投影 (Oblique Projection) 是线性代数与泛函分析中的一种线性变换,它将向量空间中的任意向量投射到某个子空间上,且投影方向不必与目标子空间正交。与之相对的是 正交投影 (Orthogonal Projection),后者要求投影方向垂直于目标子空间。斜投影在计量经济学、统计学、信号处理和数
斜投影 (Oblique Projection)
斜投影 (Oblique Projection) 是线性代数与泛函分析中的一种线性变换,它将向量空间中的任意向量投射到某个子空间上,且投影方向不必与目标子空间正交。与之相对的是 正交投影 (Orthogonal Projection),后者要求投影方向垂直于目标子空间。斜投影在计量经济学、统计学、信号处理和数值分析中有广泛应用,尤其是涉及非正交基或内生性问题的场合。
定义与基本构造
设 是一个有限维向量空间,且存在直和分解:
其中 是目标子空间(投影的"落点"), 是投影方向子空间(即投影沿 进行)。这一直和分解意味着:
对于任意向量 ,存在唯一的分解:
则定义 沿 到 上的斜投影 为线性算子 :
几何上,穿过 作一条与 平行的直线,该直线与 的交点即为投影点。当 ( 的正交补)时,斜投影退化为正交投影。
矩阵表示
设 和 分别为 和 的基矩阵(即列满秩矩阵)。则沿 到 上的斜投影矩阵为:
此处要求 可逆,这是 的代数等价条件。
当 时,上述公式退化为标准正交投影矩阵:
由此可见,斜投影将正交投影中的对称投影矩阵 替换为不对称的 。正因如此,斜投影矩阵通常是非对称的,这构成了其与正交投影的本质区别。
投影算子的性质
斜投影矩阵 满足以下基本性质:
- 幂等性 (Idempotence):。这是所有投影算子的定义性质。直观上,一旦向量已被投射到 上,再次投影不会改变结果。
- 非对称性:一般情况下 。仅当 同时为正交投影时,矩阵才是对称的。
- 像空间与零空间: \[ \operatorname{im}(P) = M, \quad \ker(P) = N \] 即投影的像等于目标子空间,投影的零空间等于投影方向子空间。
- 互补投影 (Complementary Projector):若 ,则 是沿 到 上的斜投影: \[ I - P = P_{N|M} \] 这在构造分块矩阵的逆时有重要应用。
与正交投影的关系
任一斜投影 均可通过一个非奇异变换与正交投影建立联系。具体而言,若 是到 上的正交投影,则存在可逆矩阵 使得:
其中 由 的选取决定。
一种更直接的构造方式是利用 加权内积。若定义一个新的内积 ( 为对称正定矩阵),则关于该内积的正交投影在原欧几里得度量下表现为斜投影。这一观点在广义最小二乘法 (GLS) 中尤为关键。
在计量经济学中的应用
工具变量估计
在线性回归模型 中,若 (即存在内生性),普通最小二乘法 (OLS) 不是一致的。此时使用 工具变量 (Instrumental Variables, IV) 矩阵 (满足 且 满秩),IV 估计量可写为:
其对应的拟合值矩阵为:
这正是沿 的零空间到 的列空间上的斜投影。IV 估计的本质在于:利用工具变量 将内生变量"投影"到一个与外生性约束相容的方向上。
两阶段最小二乘法 (2SLS)
两阶段最小二乘法 (Two-Stage Least Squares, 2SLS) 可紧凑地表示为两个嵌套投影:
其中 是到 列空间上的正交投影。第一阶段的拟合值 消除了内生性的影响;第二阶段将 回归到 上。
从投影视角看,2SLS 的拟合值为 ,这是一个斜投影。它与 IV 斜投影 等价,揭示了两种估计量的代数一致性。
部分回归与 Frisch-Waugh-Lovell 定理
Frisch-Waugh-Lovell定理 (FWL) 本质上是关于正交投影与斜投影交互的定理。考虑分块回归模型:
令 为到 正交补上的投影。FWL 定理表明, 的 OLS 估计等价于将 对 回归。这里的 是正交投影,但二者结合后对 的估计在原始空间中的表示就是一个斜投影。
在统计学中的其他应用
方差分析 (ANOVA) 中,当数据不平衡时,不同类型 (Type I, II, III) 的平方和分解对应不同的投影方式。Type III SS 可解释为一种斜投影分解——每个效应在调整了所有其他效应后进行检验。
线性混合模型 中,随机效应的预测(BLUP)可通过求解混合模型方程获得。该方程的解在几何上对应一个斜投影(将观测向量投射到固定效应与随机效应共同张成的空间上)。
数值计算中的注意事项
斜投影矩阵 的计算需要谨慎处理。以下是关键考虑因素:
- 条件数 (Condition Number):若 与 接近共线(即 与 夹角很小),则 接近奇异,数值反演不稳定。这在 IV 估计中对应弱工具变量问题——工具变量与内生变量的相关性过弱会导致估计量分布严重偏离。
- QR 分解:建议使用 QR 分解而非直接求逆。对 和 分别做 QR 分解 、,则投影可写为: \[ P = Q_X (Q_W^{\top} Q_X)^{-1} Q_W^{\top} \] 其中 是一个较小的矩阵,求逆更稳定。
- 矩阵无需求解:在实际应用中,通常不需要显式构造投影矩阵 ,而只需计算 对特定向量的作用。这可通过解线性方程组实现,避免了显式矩阵乘法的开销。
泛化:无限维空间中的斜投影
在希尔伯特空间或巴拿赫空间中,斜投影理论可以推广。若 是一个希尔伯特空间,且 是代数直和(不一定正交),则斜投影 是一个有界幂等算子。然而,与有限维情形不同,并非任意闭子空间对都构成拓扑直和——需要子空间满足互补条件(即 为闭集且 )。
在信号处理中,斜投影滤波器 用于在保留某一信号子空间分量的同时,完全抑制另一干扰子空间分量。这种滤波器的设计直接利用了斜投影的直和分解性质。
总结
斜投影是正交投影的直接推广,其核心是放弃了"投影方向垂直于目标空间"的约束。其代数本质是直和分解 所定义的幂等线性变换。在经济学和统计学中,斜投影构成了理解工具变量估计、2SLS、GLS 及非平衡 ANOVA 等方法的统一几何框架。掌握斜投影的代数构造与几何直觉,有助于深入理解线性模型中各种估计量的本质联系与差异。