ARTICLE

随机向量

随机向量 (Random Vector) 随机向量 (Random Vector) 是概率论与数理统计中的一个基本概念,指由多个随机变量组成的有限维向量。形式上,一个 n 维随机向量 X = (X_1, X_2, , X_n)^ 的每一个分量 X_i 都是定义在同一概率空间上的随机变量。随机向量将一元概率分布的理论自然地推广到多元情形,是多元统计分析、计量经

浏览 3 更新 2025-11-08

随机向量 (Random Vector)

随机向量 (Random Vector) 是概率论数理统计中的一个基本概念,指由多个随机变量组成的有限维向量。形式上,一个 nn 维随机向量 X=(X1,X2,,Xn)\mathbf{X} = (X_1, X_2, \ldots, X_n)^\top 的每一个分量 XiX_i 都是定义在同一概率空间上的随机变量。随机向量将一元概率分布的理论自然地推广到多元情形,是多元统计分析计量经济学机器学习的数学基础。

联合分布与边缘分布

随机向量 X\mathbf{X}联合累积分布函数 (Joint CDF) 定义为:

FX(x1,,xn)=P(X1x1,X2x2,,Xnxn).F_{\mathbf{X}}(x_1, \ldots, x_n) = P(X_1 \le x_1, X_2 \le x_2, \ldots, X_n \le x_n).

联合CDF完全刻画了随机向量的概率结构。对连续型随机向量,存在联合概率密度函数 (Joint PDF) fX(x1,,xn)f_{\mathbf{X}}(x_1, \ldots, x_n),满足:

FX(x1,,xn)=x1xnfX(t1,,tn)dtndt1.F_{\mathbf{X}}(x_1, \ldots, x_n) = \int_{-\infty}^{x_1} \cdots \int_{-\infty}^{x_n} f_{\mathbf{X}}(t_1, \ldots, t_n) \, dt_n \cdots dt_1.

每个分量 XiX_i边缘分布可通过联合分布积分消去其他变量获得:

fXi(xi)=fX(x1,,xn)dx1dxi1dxi+1dxn.f_{X_i}(x_i) = \int_{-\infty}^{\infty} \cdots \int_{-\infty}^{\infty} f_{\mathbf{X}}(x_1, \ldots, x_n) \, dx_1 \cdots dx_{i-1} dx_{i+1} \cdots dx_n.

值得注意的是,联合分布唯一确定所有边缘分布,但反过来,仅凭边缘分布一般无法唯一确定联合分布,这是因为边缘分布不包含变量间相关结构的信息。

均值向量与协方差矩阵

随机向量最重要的两个数字特征为均值向量协方差矩阵。均值向量定义为各分量期望组成的向量:

μ=E[X]=(E[X1],E[X2],,E[Xn]).\boldsymbol{\mu} = E[\mathbf{X}] = (E[X_1], E[X_2], \ldots, E[X_n])^\top.

协方差矩阵度量各分量之间的线性相关程度,定义为:

Σ=Cov(X)=E[(Xμ)(Xμ)],\boldsymbol{\Sigma} = \operatorname{Cov}(\mathbf{X}) = E[(\mathbf{X} - \boldsymbol{\mu})(\mathbf{X} - \boldsymbol{\mu})^\top],

其第 (i,j)(i, j) 元为 Cov(Xi,Xj)=E[(Xiμi)(Xjμj)]\operatorname{Cov}(X_i, X_j) = E[(X_i - \mu_i)(X_j - \mu_j)]。协方差矩阵具有以下重要性质:首先,Σ\boldsymbol{\Sigma}对称矩阵;其次,它是半正定的,即对任意非零向量 aRn\mathbf{a} \in \mathbb{R}^n,有 aΣa0\mathbf{a}^\top \boldsymbol{\Sigma} \mathbf{a} \ge 0。当 Σ\boldsymbol{\Sigma} 正定时,随机向量的分布是非退化的,即不存在分量的精确线性关系。

在数据分析中,常将协方差矩阵标准化为相关矩阵 R\mathbf{R},其元素为相关系数 ρij=Cov(Xi,Xj)Var(Xi)Var(Xj)\rho_{ij} = \frac{\operatorname{Cov}(X_i, X_j)}{\sqrt{\operatorname{Var}(X_i)\operatorname{Var}(X_j)}}。相关矩阵的对角元恒为1,非对角元的绝对值不超过1,由柯西-施瓦茨不等式保证。

独立性

随机向量的各分量相互独立当且仅当联合分布等于边缘分布的乘积。对连续型随机向量,独立性的充要条件为:

fX(x1,,xn)=fX1(x1)fX2(x2)fXn(xn).f_{\mathbf{X}}(x_1, \ldots, x_n) = f_{X_1}(x_1) \cdot f_{X_2}(x_2) \cdots f_{X_n}(x_n).

独立性是一个比不相关性更强的条件。若各分量独立,则协方差矩阵为对角矩阵。但反过来,协方差为零并不蕴含独立性,除非随机向量服从多元正态分布,此时不相关与独立等价。

多元正态分布

最重要的随机向量模型是多元正态分布,记为 XNn(μ,Σ)\mathbf{X} \sim N_n(\boldsymbol{\mu}, \boldsymbol{\Sigma}),其联合PDF为:

f(x)=1(2π)n/2Σ1/2exp(12(xμ)Σ1(xμ)),f(\mathbf{x}) = \frac{1}{(2\pi)^{n/2} |\boldsymbol{\Sigma}|^{1/2}} \exp\left(-\frac{1}{2} (\mathbf{x} - \boldsymbol{\mu})^\top \boldsymbol{\Sigma}^{-1} (\mathbf{x} - \boldsymbol{\mu})\right),

其中 Σ|\boldsymbol{\Sigma}| 为协方差矩阵的行列式。多元正态分布具有若干优良性质:任意线性变换仍为正态分布;条件分布和边缘分布均为正态;可通过Cholesky分解从一元正态生成多元正态样本。

变换与线性组合

对随机向量进行仿射变换 Y=AX+b\mathbf{Y} = \mathbf{A}\mathbf{X} + \mathbf{b},其中 A\mathbf{A}m×nm \times n 矩阵,b\mathbf{b}mm 维常向量,则:

E[Y]=Aμ+b,Cov(Y)=AΣA.E[\mathbf{Y}] = \mathbf{A}\boldsymbol{\mu} + \mathbf{b}, \quad \operatorname{Cov}(\mathbf{Y}) = \mathbf{A}\boldsymbol{\Sigma}\mathbf{A}^\top.

这组公式在回归分析中极为常用。例如,OLS估计量 β^=(XX)1Xy\hat{\boldsymbol{\beta}} = (\mathbf{X}^\top\mathbf{X})^{-1}\mathbf{X}^\top\mathbf{y} 作为随机向量 y\mathbf{y} 的线性变换,其协方差矩阵即为 σ2(XX)1\sigma^2 (\mathbf{X}^\top\mathbf{X})^{-1}

应用场景

金融计量学中,资产收益率通常建模为多元正态或更一般的多元分布随机向量,投资组合理论中的均值-方差优化完全建立在协方差矩阵之上。在多元线性回归中,被解释变量和误差项均以随机向量形式进行分析。在机器学习中,主成分分析本质上是对样本协方差矩阵进行谱分解以提取随机向量在各方向上的方差分量。随机向量作为统一多元数据的数学语言,其均值和协方差结构构成了实证统计建模的第一层描述。