期望向量 (Expected Vector)
期望向量 (Expected Vector),也称为均值向量 (Mean Vector),是多元统计与概率论中将一元随机变量的期望概念推广至随机向量的基本量。对于一个 p 维随机向量 X=(X1,X2,…,Xp)T,其期望向量定义为各分量期望组成的向量:
E[X]=μ=E[X1]E[X2]⋮E[Xp]
=
\begin{pmatrix}
\(\mu_1\) \\
\(\mu_2\) \\
\vdots \\
\(\mu_p\)
\[
\end{pmatrix}
\]
期望向量刻画了随机向量的中心位置,是多元数据分析中最基础也是最重要的描述性统计量之一。
基本性质
期望向量继承了单变量期望的线性性质。设 X 和 Y 为两个 p 维随机向量,A 为 m×p 常数矩阵,b 为 m 维常数向量,则有:
E[AX+b]=AE[X]+b
该线性性质是多元正态分布理论推导的基石,也是线性回归模型中推导OLS估计量无偏性的关键工具。若 A 退化为行向量 aT,则线性组合的期望为 E[aTX]=aTμ。
若随机向量 X 和 Y 相互独立,则交叉积的期望满足 E[XYT]=μXμYT,该性质在计算协方差矩阵时经常使用。
与协方差矩阵的关系
期望向量与协方差矩阵 Σ=Cov(X) 共同构成了多元分布的一阶矩和二阶矩完整描述。协方差矩阵定义为:
Σ=E[(X−μ)(X−μ)T]=E[XXT]−μμT
对于多元正态分布 X∼Np(μ,Σ),期望向量 μ 和协方差矩阵 Σ 完全确定了分布。期望向量的各分量 μi 也是各边际分布 Xi∼N(μi,σii) 的均值,其中 σii 为 Σ 的第 i 个对角元。
样本期望向量
给定来自某总体的 n 个独立观测 x1,x2,…,xn,样本期望向量(样本均值向量)定义为:
xˉ=n1i=1∑nxi
由大数定律,当 n→∞ 时 xˉ⟶pμ。由中心极限定理(CLT)的多元版本,n(xˉ−μ)⟶dNp(0,Σ)。这些渐近性质是多元假设检验(如 Hotelling T2 检验)的理论基础。
应用场景
期望向量在多个领域发挥核心作用。在投资组合理论中,p 种资产的期望收益率构成期望向量 μ,与协方差矩阵 Σ 一起作为均值-方差优化的输入。在主成分分析(PCA)中,数据首先通过减去样本均值向量进行中心化,然后对中心化数据的协方差矩阵做特征分解。在判别分析和聚类分析中,各类别的均值向量是构造分类规则和聚类中心的依据。在卡尔曼滤波中,状态向量的期望构成了状态预测的核心。期望向量以其简洁的线性结构和广泛的适用性,是连接一元统计与多元分析的桥梁概念。