ARTICLE

联合正态分布

联合正态分布 (Joint Normal Distribution / Multivariate Normal Distribution) 联合正态分布(又称多元正态分布或联合高斯分布)是概率论和统计学中最为重要的多元分布。一个 k 维随机向量 X = (X_1, X_2, , X_k)^T 服从联合正态分布,当且仅当其任意线性组合 a_1 X_1 + a_

浏览 3 更新 2026-05-25

联合正态分布 (Joint Normal Distribution / Multivariate Normal Distribution)

联合正态分布(又称多元正态分布或联合高斯分布)是概率论和统计学中最为重要的多元分布。一个 kk 维随机向量 X=(X1,X2,,Xk)T\mathbf{X} = (X_1, X_2, \dots, X_k)^T 服从联合正态分布,当且仅当其任意线性组合 a1X1+a2X2++akXka_1 X_1 + a_2 X_2 + \cdots + a_k X_k 服从一维正态分布。联合正态分布是线性回归假设检验贝叶斯推断等计量经济学与统计方法的核心理论支柱,其在金融学(资产组合理论)和机器学习(高斯过程)中也有广泛的应用。

定义与概率密度函数

kk 维随机向量 X\mathbf{X} 服从均值为 μRk\boldsymbol{\mu} \in \mathbb{R}^k、协方差矩阵为 ΣRk×k\boldsymbol{\Sigma} \in \mathbb{R}^{k \times k}(正定)的联合正态分布,记作 XNk(μ,Σ)\mathbf{X} \sim \mathcal{N}_k(\boldsymbol{\mu}, \boldsymbol{\Sigma}),其概率密度函数为:

f(x)=1(2π)k/2Σ1/2exp(12(xμ)TΣ1(xμ))f(\mathbf{x}) = \frac{1}{(2\pi)^{k/2} |\boldsymbol{\Sigma}|^{1/2}} \exp\left(-\frac{1}{2}(\mathbf{x} - \boldsymbol{\mu})^T \boldsymbol{\Sigma}^{-1} (\mathbf{x} - \boldsymbol{\mu})\right)

其中 Σ|\boldsymbol{\Sigma}|Σ\boldsymbol{\Sigma} 的行列式。密度函数的等高线构成以 μ\boldsymbol{\mu} 为中心的椭圆体,主轴方向由 Σ\boldsymbol{\Sigma} 的特征向量确定,轴的长度与对应特征值的平方根成正比。

均值向量与协方差矩阵

联合正态分布完全由其前两阶矩刻画。均值向量 μ=E[X]=(E[X1],,E[Xk])T\boldsymbol{\mu} = E[\mathbf{X}] = (E[X_1], \dots, E[X_k])^T 给出了每一分量的均值;协方差矩阵 Σ=Cov(X)=E[(Xμ)(Xμ)T]\boldsymbol{\Sigma} = \text{Cov}(\mathbf{X}) = E[(\mathbf{X} - \boldsymbol{\mu})(\mathbf{X} - \boldsymbol{\mu})^T] 的元素为各分量之间的协方差 σij=Cov(Xi,Xj)\sigma_{ij} = \text{Cov}(X_i, X_j)。矩阵 Σ\boldsymbol{\Sigma} 的对角元 σii=Var(Xi)\sigma_{ii} = \text{Var}(X_i) 是各分量的方差,非对角元 σij\sigma_{ij}iji \neq j)度量了两分量之间的线性关联强度。

核心性质

联合正态分布拥有一系列对统计推断至关重要的性质:

  1. 线性组合不变性:若 XNk(μ,Σ)\mathbf{X} \sim \mathcal{N}_k(\boldsymbol{\mu}, \boldsymbol{\Sigma}),则对任意矩阵 ARm×k\mathbf{A} \in \mathbb{R}^{m \times k} 和向量 bRm\mathbf{b} \in \mathbb{R}^m,有 AX+bNm(Aμ+b,AΣAT)\mathbf{AX} + \mathbf{b} \sim \mathcal{N}_m(\mathbf{A}\boldsymbol{\mu} + \mathbf{b}, \mathbf{A}\boldsymbol{\Sigma}\mathbf{A}^T)
  2. 边际分布X\mathbf{X} 的任意子向量均服从联合正态分布,其均值和协方差矩阵为原均值向量和协方差矩阵的对应子块。特别地,每一分量 XiX_i 服从一维正态 N(μi,σii)\mathcal{N}(\mu_i, \sigma_{ii})
  3. 条件分布:若将 X\mathbf{X} 划分为 (X1,X2)T(\mathbf{X}_1, \mathbf{X}_2)^T,则在给定 X2=x2\mathbf{X}_2 = \mathbf{x}_2 的条件下,X1\mathbf{X}_1 的条件分布仍为联合正态,其均值为: \[ E[\mathbf{X}_1 \mid \mathbf{X}_2 = \mathbf{x}_2] = \boldsymbol{\mu}_1 + \boldsymbol{\Sigma}_{12} \boldsymbol{\Sigma}_{22}^{-1} (\mathbf{x}_2 - \boldsymbol{\mu}_2) \] 这与线性回归的预测公式形式一致,揭示了联合正态与线性模型的深层联系。
  4. 独立性与不相关性等价:在联合正态分布下,两子向量(或两分量)相互独立的充要条件是它们的协方差矩阵为零。这是一维正态不具备的特殊性质。
  5. 二次型与卡方分布(Xμ)TΣ1(Xμ)(\mathbf{X} - \boldsymbol{\mu})^T \boldsymbol{\Sigma}^{-1} (\mathbf{X} - \boldsymbol{\mu}) 服从自由度为 kk卡方分布 χk2\chi_k^2,这一性质广泛应用于Wald检验和置信椭球的构造。

在经济与金融中的应用

在计量经济学中,线性回归模型通常假定误差项服从联合正态分布 Nn(0,σ2In)\mathcal{N}_n(\mathbf{0}, \sigma^2 \mathbf{I}_n),由此导出最小二乘估计量 β^Nk(β,σ2(XTX)1)\hat{\boldsymbol{\beta}} \sim \mathcal{N}_k(\boldsymbol{\beta}, \sigma^2 (\mathbf{X}^T \mathbf{X})^{-1}),并在此基础上构造 tt 检验、FF 检验和置信区间。

在金融学中,马科维茨投资组合理论假设多种资产的收益率服从联合正态分布,此时投资组合的收益率(作为各资产收益率的线性组合)自动服从一维正态,从而仅由均值和方差即可完整描述投资的风险与收益。资本资产定价模型(CAPM)同样建立在资产收益率联合正态的假设之上。

在时间序列分析中,向量自回归模型(VAR)的误差项通常假定为联合正态白噪声过程,使得最大似然估计等价于最小二乘估计,并简化了脉冲响应函数和预测误差方差的推导。

联合正态分布由卡尔·弗里德里希·高斯亚伯拉罕·棣莫弗等人奠基,其多变量理论在 20 世纪由哈罗德·霍特林约翰·维希特等人的工作发展为成熟体系,是现代多元统计分析(参见因子分析主成分分析)不可动摇的基础。