ARTICLE

二阶矩

二阶矩 (Second Moment) 二阶矩 (Second Moment) 是概率论和统计学中描述随机变量分布特征的一类核心数字特征。对随机变量 X ,其(原点)二阶矩定义为 E[X^2] ,即随机变量平方的期望值。与之紧密关联的概念是中心二阶矩 E[(X - )^2] ,其中 = E[X] 为一阶矩(均值),中心二阶矩即为我们熟知的方差。二阶矩是矩族中

浏览 0 更新 2025-10-30

二阶矩 (Second Moment)

二阶矩 (Second Moment) 是概率论和统计学中描述随机变量分布特征的一类核心数字特征。对随机变量 X X ,其(原点)二阶矩定义为 E[X2] E[X^2] ,即随机变量平方的期望值。与之紧密关联的概念是中心二阶矩 E[(Xμ)2] E[(X - \mu)^2] ,其中 μ=E[X] \mu = E[X] 一阶矩(均值),中心二阶矩即为我们熟知的方差。二阶矩是矩族中最重要的成员之一,与一阶矩共同构成了对随机变量分布最基础也最常用的刻画。

定义与分类

对随机变量 X X 和正整数 k k k k 阶原点矩定义为 μk=E[Xk] \mu'_k = E[X^k] k k 阶中心矩定义为 μk=E[(XE[X])k] \mu_k = E[(X - E[X])^k] 。因此:

  • 原点二阶矩μ2=E[X2] \mu'_2 = E[X^2]
  • 中心二阶矩μ2=E[(Xμ)2]=Var(X) \mu_2 = E[(X - \mu)^2] = \operatorname{Var}(X)

两者之间满足典形的方差分解恒等式:

Var(X)=E[X2](E[X])2\operatorname{Var}(X) = E[X^2] - (E[X])^2

即中心二阶矩等于原点二阶矩减去一阶矩的平方。这一关系在计算中极为实用:往往先计算 E[X2] E[X^2] E[X] E[X] ,再间接得到方差。

与方差的关系

二阶矩与方差的区分在教学中常被忽视,但有其重要性。方差 Var(X)=E[(Xμ)2] \operatorname{Var}(X) = E[(X - \mu)^2] 中心二阶矩,衡量的是 X X 围绕其均值的离散程度;而原点二阶矩 E[X2] E[X^2] 同时包含了均值和方差的信息。只有当 μ=0 \mu = 0 (即随机变量已中心化)时,两者才相等。

一个常见的混淆来源是:样本方差的分母为 n1 n-1 而非 n n ,这是为了保证样本方差是总体方差的无偏估计。而样本二阶矩 n1i=1nXi2 n^{-1} \sum_{i=1}^n X_i^2 的计算并无此校正需要。在最大似然估计 (MLE) 中,方差估计量使用 n n 作为分母(有偏但渐近有效),对应的是中心二阶矩的自然样本类比如。

矩母函数与特征函数

二阶矩在矩母函数 (Moment Generating Function, MGF) 框架中处于核心地位。随机变量 X X 的矩母函数定义为 MX(t)=E[etX] M_X(t) = E[e^{tX}] ,对其求二阶导数并在 t=0 t = 0 处取值即得原点二阶矩:

E[X2]=d2dt2MX(t)t=0E[X^2] = \left. \frac{d^2}{dt^2} M_X(t) \right|_{t=0}

类似地,从特征函数 ϕX(t)=E[eitX] \phi_X(t) = E[e^{itX}] 也可通过求导获取二阶矩。MGF 的存在性要求所有矩有限,而特征函数始终存在,这使后者在理论推导中更为通用。

二阶矩在计量经济学中的应用

二阶矩是计量经济学估计与推断的基石,几乎贯穿所有核心方法:

普通最小二乘法 (OLS)

在经典线性回归模型 y=Xβ+ε \mathbf{y} = \mathbf{X}\boldsymbol{\beta} + \boldsymbol{\varepsilon} 中,OLS 估计量的方差-协方差矩阵为:

Var(β^X)=σ2(XX)1\operatorname{Var}(\hat{\boldsymbol{\beta}} | \mathbf{X}) = \sigma^2 (\mathbf{X}'\mathbf{X})^{-1}

其中 σ2=E[εi2] \sigma^2 = E[\varepsilon_i^2] 即为误差项的二阶原点矩(在 E[εi]=0 E[\varepsilon_i] = 0 假设下等于方差)。该矩阵的对角元素构成系数估计的标准误,是所有 t t 检验和置信区间构建的基础。

异方差与稳健标准误

当误差项的二阶矩非常数——即 E[εi2X]σ2 E[\varepsilon_i^2 | \mathbf{X}] \neq \sigma^2 (与 X \mathbf{X} 相关)——出现异方差。此时 OLS 仍然无偏一致,但基于同方差假设的标准误不再有效。White 异方差稳健标准误(Huber-White sandwich estimator)正是通过直接估计误差二阶矩的样本类如来修正这一问题:

Var^(β^)=(XX)1(i=1nε^i2xixi)(XX)1\widehat{\operatorname{Var}}(\hat{\boldsymbol{\beta}}) = (\mathbf{X}'\mathbf{X})^{-1} \left( \sum_{i=1}^n \hat{\varepsilon}_i^2 \mathbf{x}_i \mathbf{x}_i' \right) (\mathbf{X}'\mathbf{X})^{-1}

其中 ε^i2 \hat{\varepsilon}_i^2 是对单个观测误差二阶矩的估计。

广义矩方法 (GMM)

广义矩方法 (Generalized Method of Moments, GMM) 将二阶矩条件系统化。在 GMM 框架中,许多经济模型的识别依赖于二阶矩条件,例如:

  • 理性预期模型中的正交条件 E[ztεt+1]=0 E[z_t \varepsilon_{t+1}] = 0 ,其样本类如要求对交叉矩的收敛
  • 工具变量估计中,最佳权重矩阵为 Ω=E[ziziεi2] \boldsymbol{\Omega} = E[z_i z_i' \varepsilon_i^2] ,这正是工具变量与误差平方交乘项的二阶矩
  • 资产定价中,随机贴现因子的二阶矩决定了夏普比率的上界(Hansen-Jagannathan 界)

时间序列:ARCH/GARCH 模型

金融时间序列分析中,自回归条件异方差 (ARCH) 及其推广 GARCH 模型直接对方差(条件二阶矩)的时变结构建模。该模型的核心思想是:虽然收益率序列本身可能接近白噪声,但其二阶矩——波动率——呈现显著的波动率聚集特征。这使二阶矩从静态参数变为动态过程,深刻改变了金融风险管理和衍生品定价的实践。

金融学中的二阶矩

现代投资组合理论 (Markowitz, 1952) 中,二阶矩——以协方差矩阵的形式——是投资决策的核心输入。均值-方差优化框架下,投资者在给定收益水平下追求方差最小化(或等价地,在给定方差下追求收益最大化)。资产 i i j j 收益之间的协方差 Cov(Ri,Rj) \operatorname{Cov}(R_i, R_j) 正是交叉中心二阶矩 E[(Riμi)(Rjμj)] E[(R_i - \mu_i)(R_j - \mu_j)]

二阶矩在金融中的关键角色还包括:

  • 风险价值 (VaR)预期短缺 (ES):在正态假设下,VaR 的计算仅依赖方差(二阶矩);当分布存在肥尾时,更高阶矩变得重要
  • 期权定价Black-Scholes 公式中,波动率参数 σ \sigma (标准差的年化值)直接来自标的资产收益的二阶矩
  • 实现波动率:基于高频日内数据的已实现方差 RVt=i=1nrt,i2 RV_t = \sum_{i=1}^n r_{t,i}^2 利用日内收益平方和估计积分方差,在无噪音且收益均值为零时正是二阶矩的直接估计

样本二阶矩与渐近性质

给定独立同分布样本 X1,,Xn X_1, \ldots, X_n ,样本原点二阶矩为 μ^2=n1i=1nXi2 \hat{\mu}'_2 = n^{-1} \sum_{i=1}^n X_i^2 。由大数定律μ^2pE[X2] \hat{\mu}'_2 \xrightarrow{p} E[X^2] (一致性)。由中心极限定理(假设四阶矩有限,即 E[X4]< E[X^4] < \infty ):

n(μ^2E[X2])dN(0,Var(X2))\sqrt{n} \left( \hat{\mu}'_2 - E[X^2] \right) \xrightarrow{d} \mathcal{N}(0, \operatorname{Var}(X^2))

其中 Var(X2)=E[X4](E[X2])2 \operatorname{Var}(X^2) = E[X^4] - (E[X^2])^2 ,涉及四阶矩 E[X4] E[X^4] 。这一事实揭示了二阶矩推断对高阶矩的依赖性:要想可靠估计方差(二阶矩),需要峰度(四阶矩)的有限性作为前提。在金融数据中,收益序列的四阶矩往往很大甚至无限,这对基于二阶矩的统计推断构成了实质挑战。

与其他阶矩的关系

二阶矩在矩序列中承上启下:

  • 一阶矩(均值)描述位置,二阶矩描述离散度——均值-方差分析范式正是基于前两阶矩对分布的完整刻画(在正态分布下,前两阶矩完全确定分布)
  • 三阶矩(偏度)标准化三阶矩 E[(Xμ)3]/σ3 E[(X - \mu)^3] / \sigma^3 描述不对称性,二阶矩 σ2 \sigma^2 出现在分母中,使偏度成为尺度无关的度量
  • 四阶矩(峰度)标准化四阶矩描述尾部厚度,同样以二阶矩的平方 σ4 \sigma^4 为分母进行标准化

在正态分布下,所有 k3 k \geq 3 的奇数阶中心矩为零,偶数阶中心矩可完全由二阶矩表示:μ2k=σ2k(2k1)!! \mu_{2k} = \sigma^{2k} (2k-1)!! 。这突显了二阶矩在正态世界的特殊地位。

二阶矩不存在的情形

并非所有分布都有有限的二阶矩。典形例子包括:

  • 柯西分布:其密度函数为 f(x)=[π(1+x2)]1 f(x) = [\pi(1 + x^2)]^{-1} ,一阶矩即不存在,二阶矩自然也无定义
  • 自由度 ν2 \nu \leq 2 t t 分布:当 ν=1 \nu = 1 (即柯西分布)时均值和方差均不存在;ν=2 \nu = 2 时均值存在但方差无限。只有 ν>2 \nu > 2 时才有有限方差
  • 某些 Pareto 分布:当尾部指数 α2 \alpha \leq 2 时二阶矩无限,这对金融和极值建模有重要含义

肥尾分布下二阶矩不存在或极大,均值-方差分析和基于正态假设的显著性检验都可能产生严重误导。这启发了一系列不依赖二阶矩的稳健方法,如分位数回归MAD(中位数绝对离差)以及基于极值理论的风险建模。