ARTICLE

方差-协方差矩阵

方差-协方差矩阵 (Variance-Covariance Matrix) 方差-协方差矩阵 (Variance-Covariance Matrix)，简称协方差矩阵 (Covariance Matrix)，是概率论与统计学中描述一组随机变量之间线性关联结构的核心工具。它是一个方阵，全面刻画了多维随机向量的二阶矩信息——对角线承载各变量自身的

浏览 56 更新 2026-01-16

方差-协方差矩阵 (Variance-Covariance Matrix)

方差-协方差矩阵 (Variance-Covariance Matrix)，简称 协方差矩阵 (Covariance Matrix)，是概率论与统计学中描述一组随机变量之间线性关联结构的核心工具。它是一个方阵，全面刻画了多维随机向量的二阶矩信息——对角线承载各变量自身的方差（波动程度），非对角线承载两两变量之间的协方差（联动方向与强度）。该矩阵构成了多元统计分析、计量经济学和金融学中风险建模与推断的理论基石。理解其结构与性质，是深入学习任何涉及多维数据分析领域的前提。

数学定义与结构

设 $\mathbf{X} = [X_1, X_2, \ldots, X_n]^T$ 为 $n$ 维随机向量，其均值向量 $\boldsymbol{\mu} = E[\mathbf{X}]$ 。方差-协方差矩阵 $\boldsymbol{\Sigma}$ 由外积的期望定义：

\boldsymbol{\Sigma} = E\left[ (\mathbf{X} - \boldsymbol{\mu})(\mathbf{X} - \boldsymbol{\mu})^T \right]

展开后， $\boldsymbol{\Sigma}$ 是一个 $n \times n$ 的矩阵：

\boldsymbol{\Sigma} = \begin{pmatrix} \mathrm{Var}(X_1) & \mathrm{Cov}(X_1, X_2) & \cdots & \mathrm{Cov}(X_1, X_n) \\ \mathrm{Cov}(X_2, X_1) & \mathrm{Var}(X_2) & \cdots & \mathrm{Cov}(X_2, X_n) \\ \vdots & \vdots & \ddots & \vdots \\ \mathrm{Cov}(X_n, X_1) & \mathrm{Cov}(X_n, X_2) & \cdots & \mathrm{Var}(X_n) \end{pmatrix}

其中 $\Sigma_{ii} = \mathrm{Var}(X_i) = E[(X_i - \mu_i)^2]$ 度量第 $i$ 个变量偏离其均值的平均平方幅度； $\Sigma_{ij} = \mathrm{Cov}(X_i, X_j) = E[(X_i - \mu_i)(X_j - \mu_j)]$ 度量两变量同向或反向联动的倾向——正值表示同向变动，负值表示反向变动，零表示无线性关联。由于 $\mathrm{Cov}(X_i, X_j) = \mathrm{Cov}(X_j, X_i)$ ，该矩阵必然是一个对称矩阵。从几何角度看， $\boldsymbol{\Sigma}$ 的每个元素都刻画了随机向量在 $n$ 维空间中的散布椭球——对角线控制各轴方向的延展幅度，非对角线控制椭球的旋转与倾斜。

核心性质

方差-协方差矩阵具备若干关键数学性质，这些性质使其在理论推导和应用计算中都极为便利。

对称性： $\boldsymbol{\Sigma} = \boldsymbol{\Sigma}^T$ 。这一性质意味着矩阵可被正交对角化，为后续的特征分解和主成分分析奠定基础。
半正定性：对任意非零实向量 $\mathbf{a} \in \mathbb{R}^n$ ，二次型 $\mathbf{a}^T \boldsymbol{\Sigma} \mathbf{a} \ge 0$ 。原因在于 $\mathbf{a}^T \boldsymbol{\Sigma} \mathbf{a} = \mathrm{Var}(\mathbf{a}^T \mathbf{X})$ ，而方差本身必定非负。若随机变量之间不存在完全多重共线性（即没有任何一个变量可被其他变量的线性组合精确表示），则对所有非零 $\mathbf{a}$ 有严格不等式成立，此时 $\boldsymbol{\Sigma}$ 升级为 正定矩阵，保证可逆且 Cholesky 分解可行。在数值计算中，Cholesky 分解将 $\boldsymbol{\Sigma}$ 表为 $\mathbf{L}\mathbf{L}^T$ （ $\mathbf{L}$ 为下三角阵），这一分解在蒙特卡洛模拟中广泛用于生成具有给定协方差结构的多元正态样本，也是许多优化算法的预处理步骤。
线性变换规则：若新随机向量 $\mathbf{Y}$ 由仿射变换 $\mathbf{Y} = \mathbf{A}\mathbf{X} + \mathbf{b}$ 得到（ $\mathbf{A} \in \mathbb{R}^{m \times n}$ ， $\mathbf{b} \in \mathbb{R}^m$ 为常数），则： \[ \mathrm{Cov}(\mathbf{Y}) = \mathbf{A} \boldsymbol{\Sigma} \mathbf{A}^T \] 这一规则将复杂的非线性协方差计算转化为简洁的矩阵乘法，在现代投资组合理论的资产组合风险分解和多元线性回归的系数推断中均扮演核心角色。
与相关系数矩阵的联系：协方差的值受变量量纲影响，不便于跨变量比较。令 $\mathbf{D} = \mathrm{diag}(\sigma_1, \ldots, \sigma_n)$ 为各变量标准差构成的对角阵（ $\sigma_i = \sqrt{\mathrm{Var}(X_i)}$ ），则相关系数矩阵 $\mathbf{R}$ 满足： \[ \boldsymbol{\Sigma} = \mathbf{D} \mathbf{R} \mathbf{D}, \quad \mathbf{R} = \mathbf{D}^{-1} \boldsymbol{\Sigma} \mathbf{D}^{-1} \] $\mathbf{R}$ 的对角线全为 1，非对角线元素 $\rho_{ij} \in [-1, 1]$ 为 Pearson 相关系数，消除了量纲，使不同变量对之间的线性关联强度可横向比较。

样本协方差矩阵

现实中的总体协方差矩阵 $\boldsymbol{\Sigma}$ 极少已知，须从观测数据中估计。设有 $m$ 组独立同分布的 $n$ 维观测向量 $\mathbf{x}_1, \mathbf{x}_2, \ldots, \mathbf{x}_m$ ，首先计算样本均值：

\hat{\boldsymbol{\mu}} = \frac{1}{m} \sum_{k=1}^m \mathbf{x}_k

则 样本协方差矩阵 $\mathbf{S}$ 定义为：

\mathbf{S} = \frac{1}{m-1} \sum_{k=1}^m (\mathbf{x}_k - \hat{\boldsymbol{\mu}})(\mathbf{x}_k - \hat{\boldsymbol{\mu}})^T

此处分母选用 $m-1$ 而非最大似然估计的 $m$ ，源于 贝塞尔校正 (Bessel's Correction)：以样本均值替代未知的总体均值会消耗一个自由度，使用 $m-1$ 可确保 $\mathbf{S}$ 是 $\boldsymbol{\Sigma}$ 的无偏估计，即 $E[\mathbf{S}] = \boldsymbol{\Sigma}$ 。当样本量 $m$ 较小时，这一校正至关重要；当 $m \to \infty$ 时，两种定义渐近等价。在 $n > m$ 的高维设定下，样本协方差矩阵 $\mathbf{S}$ 即使作为估计量是无偏的，也会变为奇异矩阵而不可逆，此时须借助收缩估计 (Shrinkage Estimation) 或稀疏性假设下的正则化方法（如 Graphical Lasso）来获得结构良好且可用的协方差矩阵估计。

典型应用

方差-协方差矩阵在多个学科中具有不可替代的应用价值。

金融学与投资组合理论：在哈里·马科维茨创立的 现代投资组合理论 (Modern Portfolio Theory, MPT) 中， $n$ 项风险资产构成的投资组合，其收益方差（风险度量）为二次型 $\sigma_p^2 = \mathbf{w}^T \boldsymbol{\Sigma} \mathbf{w}$ ，其中 $\mathbf{w}$ 为资产权重向量。分散化原理 的核心在于：只要资产间相关系数 $\rho_{ij} < 1$ ，组合方差便严格小于各资产方差的加权平均。通过求解二次规划问题，投资者可在给定收益水平下最小化 $\sigma_p^2$ ，从而构造 有效前沿 (Efficient Frontier)。
计量经济学与统计推断：在多元线性回归模型 $\mathbf{y} = \mathbf{X}\boldsymbol{\beta} + \boldsymbol{\epsilon}$ 中，普通最小二乘法 (OLS) 估计量 $\hat{\boldsymbol{\beta}} = (\mathbf{X}^T\mathbf{X})^{-1}\mathbf{X}^T\mathbf{y}$ 的协方差矩阵为： \[ \mathrm{Cov}(\hat{\boldsymbol{\beta}}) = \sigma^2 (\mathbf{X}^T\mathbf{X})^{-1} \] 其中 $\sigma^2$ 为误差项方差， $\mathbf{X}$ 为设计矩阵。该矩阵的对角线元素给出各回归系数估计量的标准误，是进行假设检验（如 t 检验判断单个系数的显著性、F 检验判断多个线性约束的联合显著性）和构造置信区间的核心输入。当误差项存在异方差或自相关时，需使用稳健协方差矩阵估计（如 White 或 Newey-West 估计量）替代上述经典形式。
多元统计与降维：在主成分分析 (Principal Component Analysis, PCA) 中，对 $\boldsymbol{\Sigma}$ （或对标准化后的相关系数矩阵 $\mathbf{R}$ ，以消除量纲差异导致的偏差）进行 谱分解： $\boldsymbol{\Sigma} = \mathbf{Q} \boldsymbol{\Lambda} \mathbf{Q}^T$ ，其中 $\boldsymbol{\Lambda} = \mathrm{diag}(\lambda_1, \ldots, \lambda_n)$ 为降序排列的 特征值， $\mathbf{Q}$ 的列向量为对应的 特征向量。第一主成分方向由最大特征值对应的特征向量给出，保留了数据最大的方差分量；保留前 $k$ 个主成分即可在损失最少信息的前提下实现降维。此外，在多元正态分布 $\mathcal{N}(\boldsymbol{\mu}, \boldsymbol{\Sigma})$ 中， $\boldsymbol{\Sigma}$ 完全决定了概率密度等高线的形状、方向和散布程度——若 $\boldsymbol{\Sigma}$ 为对角阵则各维独立，若为单位阵则退化为各向同性的标准正态。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。