ARTICLE

奇异值分解

奇异值分解（Singular Value Decomposition, SVD）是线性代数中一种极为重要的矩阵分解方法，它将任意一个矩阵分解为三个矩阵的乘积。具体而言，对于任意一个 m n 的实矩阵 A ，奇异值分解将其表示为 A = U V^ T ，其中 U 是 m m 的正交矩阵，其列向量称为左奇异向量； V 是 n n 的正交矩阵，其列向量称为右奇异向

浏览 3 更新 2025-11-08

奇异值分解（Singular Value Decomposition, SVD）是线性代数中一种极为重要的矩阵分解方法，它将任意一个矩阵分解为三个矩阵的乘积。具体而言，对于任意一个 $m \times n$ 的实矩阵 $\mathbf{A}$ ，奇异值分解将其表示为 $\mathbf{A} = \mathbf{U} \mathbf{\Sigma} \mathbf{V}^\mathsf{T}$ ，其中 $\mathbf{U}$ 是 $m \times m$ 的正交矩阵，其列向量称为左奇异向量； $\mathbf{V}$ 是 $n \times n$ 的正交矩阵，其列向量称为右奇异向量； $\mathbf{\Sigma}$ 是 $m \times n$ 的对角矩阵，其对角线上非零的元素 $\sigma_1 \ge \sigma_2 \ge \cdots \ge \sigma_r > 0$ 称为奇异值， $r$ 为矩阵 $\mathbf{A}$ 的秩。奇异值的个数等于矩阵的秩，且奇异值从大到小排列，这一排序特性是许多应用的关键基础。

奇异值分解的核心思想在于，任何矩阵都可以通过旋转、缩放和再旋转的方式完全表征。从几何角度来看， $\mathbf{V}^\mathsf{T}$ 将原始空间中的向量旋转到一组标准正交基方向， $\mathbf{\Sigma}$ 沿这些方向进行缩放（缩放因子即为奇异值），最后 $\mathbf{U}$ 将结果向量旋转到目标空间。这组标准正交基方向正是矩阵 $\mathbf{A}^\mathsf{T}\mathbf{A}$ 的特征向量方向，而奇异值的平方对应 $\mathbf{A}^\mathsf{T}\mathbf{A}$ 的特征值。奇异值分解与矩阵的特征值分解密切相关但更为普适。特征值分解仅适用于方阵且要求矩阵可对角化，而奇异值分解对任意矩阵都成立——无论是长方形矩阵、奇异矩阵还是非对称矩阵。这使奇异值分解成为数据分析中最强大且最通用的工具之一。

奇异值分解的历史可以追溯到十九世纪。1870年代，意大利数学家贝尔特拉米（Eugenio Beltrami）和法国数学家若尔当（Camille Jordan）几乎同时独立提出了奇异值分解的基本概念。此后，希尔伯特（David Hilbert）、施密特（Erhard Schmidt）和魏尔（Hermann Weyl）等数学巨匠对奇异值理论的发展作出了重要贡献。到了二十世纪中期，随着电子计算机的出现，奇异值分解的数值计算方法得到系统发展，高尔布（Gene Golub）和卡汉（William Kahan）等人提出了稳定高效的数值算法，使得奇异值分解从纯粹的数学理论转变为实用的计算工具。

在数据科学领域，奇异值分解最重要的应用之一是主成分分析（PCA）。对数据矩阵进行中心化后做奇异值分解，右奇异向量即为主成分方向，奇异值的大小反映了各主成分解释方差的比例。通过保留前 $k$ 个最大的奇异值及其对应的奇异向量，可以实现数据降维，在损失尽可能少信息的条件下大幅减少数据维度。这一技术在基因表达数据分析、金融风险因子提取、图像特征提取等领域得到广泛应用。

另一个经典应用是矩阵的低秩近似。根据Eckart-Young定理，在Frobenius范数意义下，保留前 $k$ 个最大奇异值并置零其余奇异值所得到的矩阵，是原矩阵在秩不超过 $k$ 的所有矩阵中的最优近似。这为图像压缩提供了理论基础：将一张 $m \times n$ 的灰度图像视为矩阵，对其做奇异值分解后仅保留前 $k$ 个奇异值（ $k \ll \min(m,n)$ ），存储空间从 $m \times n$ 降至 $k(m+n+1)$ ，大幅节省存储成本。随着 $k$ 的增大，压缩图像的质量逐步提升，用户可以在压缩比和图像质量之间灵活权衡。彩色图像可对各颜色通道分别做奇异值分解压缩，效果同样显著。

在推荐系统中，奇异值分解被广泛应用于协同过滤。用户-物品评分矩阵通常极为稀疏且维度极高。通过对评分矩阵进行奇异值分解并取低秩近似，可以挖掘用户和物品的潜在因子表示，进而预测用户对未评分物品的偏好。Netflix Prize竞赛中，基于奇异值分解的模型取得了显著成功，推动了推荐系统技术的快速发展。在此基础上发展出的SVD++等变体进一步融合了隐式反馈信息，提升了推荐精度。

在自然语言处理领域，潜在语义分析（LSA）直接基于奇异值分解构建。将文档-词项矩阵分解后，降维得到的潜在语义空间能够捕捉词项与文档之间的隐含语义关联，缓解同义词和多义词问题，改善信息检索的效果。尽管后来被更复杂的主题模型（如LDA）部分取代，潜在语义分析因其计算效率高且结果可解释而仍在许多场景中使用。

奇异值分解在信号处理、控制理论、量子计算等领域同样发挥着重要作用。在信号处理中，基于奇异值分解的降噪方法通过将小奇异值置零来滤除噪声分量，降噪效果显著。在控制理论中，奇异值用于分析系统的鲁棒稳定性，H-infinity控制理论的核心工具之一即为奇异值分析。在量子信息科学中，Schmidt分解（奇异值分解在量子态张量积空间中的形式）是描述量子纠缠的关键数学工具，纠缠度量的计算直接依赖于Schmidt系数的奇异值分布。

计算奇异值分解的数值算法经历了长期发展。最常用的方法包括分而治之法、QR迭代法和Jacobi方法。对于大规模稀疏矩阵，通常采用Lanczos迭代等算法仅计算前若干个最大的奇异值和对应的奇异向量。现代线性代数库（如LAPACK、Intel MKL）提供了高效稳定的奇异值分解实现，支持GPU加速以处理超大规模矩阵。在深度学习框架（如PyTorch、TensorFlow）中，奇异值分解也被作为标准操作集成，支持自动微分，便于在神经网络中应用。

尽管奇异值分解理论优美且应用广泛，但在处理极大规模数据时仍面临计算和存储挑战。随机化奇异值分解（Randomized SVD）等新兴方法通过引入随机采样技术，在保证近似精度的前提下显著降低了计算复杂度，使得对百万维级别矩阵的奇异值分解成为可能。此外，增量式奇异值分解算法能够随新数据的到来动态更新分解结果，适用于流数据场景。

综上所述，奇异值分解从线性代数的基本理论出发，经由数值计算的持续优化，已成为连接数学理论与实际应用的重要桥梁。在数据驱动的现代科技中，从搜索引擎到推荐系统，从图像处理到生物信息学，奇异值分解的影响无处不在，堪称线性代数在应用领域最重要的成果之一。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。