ARTICLE

原点矩

原点矩 (Raw Moment) 原点矩(raw moment),又称粗矩,是概率论与数理统计中描述概率分布数值特征的一类基本统计量。对于随机变量 X,其关于原点 0 的 k 阶矩定义为 _k' = E[X^k] ,即随机变量 k 次幂的期望。原点矩是矩(moment)概念中最基础的形式,与之相对的是中心矩(central moment),后者描述随机变量偏

浏览 5 更新 2026-07-14

原点矩 (Raw Moment)

原点矩(raw moment),又称粗矩,是概率论数理统计中描述概率分布数值特征的一类基本统计量。对于随机变量 XX,其关于原点 00kk 阶矩定义为 μk=E[Xk] \mu_k' = E[X^k] ,即随机变量 kk 次幂的期望。原点矩是(moment)概念中最基础的形式,与之相对的是中心矩(central moment),后者描述随机变量偏离其均值的程度。原点矩与中心矩共同构成了矩理论的核心框架,在分布拟合参数估计(如矩估计法)和假设检验中具有广泛应用。

定义与分类

XX 为一随机变量,其 kk 阶原点矩定义为:

μk=E[Xk]={ixikp(xi),X 为离散型随机变量xkf(x)dx,X 为连续型随机变量\mu_k' = E[X^k] = \begin{cases} \sum_i x_i^k \, p(x_i), & X \text{ 为离散型随机变量} \\ \int_{-\infty}^{\infty} x^k \, f(x) \, dx, & X \text{ 为连续型随机变量} \end{cases}

其中 p(xi)p(x_i) 为离散型随机变量的概率质量函数(PMF),f(x)f(x) 为连续型随机变量的概率密度函数(PDF)。前提条件是上述积分或级数绝对收敛。各阶原点矩各有其统计含义:

  • 一阶原点矩 μ1=E[X]\mu_1' = E[X]:即随机变量的均值(mean),是分布的中心位置度量,反映数据的集中趋势。
  • 二阶原点矩 μ2=E[X2]\mu_2' = E[X^2]:与方差的关系为 Var(X)=μ2(μ1)2\Var(X) = \mu_2' - (\mu_1')^2,是计算方差和标准差的基础。
  • 三阶原点矩 μ3=E[X3]\mu_3' = E[X^3]:用于计算偏度(skewness),衡量分布的非对称性。
  • 四阶原点矩 μ4=E[X4]\mu_4' = E[X^4]:用于计算峰度(kurtosis),衡量分布的尾部厚度和峰态。

原点矩与中心矩的关系

中心矩定义为 μk=E[(Xμ)k]\mu_k = E[(X - \mu)^k],其中 μ=E[X]\mu = E[X]。二者可通过二项式定理相互转换。将 (Xμ)k(X - \mu)^k 展开:

μk=E[(Xμ)k]=j=0k(kj)E[Xkj](μ)j=j=0k(kj)μkj(μ1)j\mu_k = E[(X - \mu)^k] = \sum_{j=0}^k \binom{k}{j} E[X^{k-j}] (-\mu)^{j} = \sum_{j=0}^k \binom{k}{j} \mu_{k-j}' (-\mu_1')^{j}

反过来,原点矩也可由中心矩表示:

μk=E[(μ+(Xμ))k]=j=0k(kj)μkjμj\mu_k' = E[(\mu + (X - \mu))^k] = \sum_{j=0}^k \binom{k}{j} \mu^{k-j} \mu_j

其中 μ0=μ0=1\mu_0' = \mu_0 = 1 为约定。据此,低阶矩的具体转换关系为:

  • μ1=0\mu_1 = 0(一阶中心矩恒为零)
  • μ2=μ2(μ1)2\mu_2 = \mu_2' - (\mu_1')^2(方差)
  • μ3=μ33μ2μ1+2(μ1)3\mu_3 = \mu_3' - 3\mu_2'\mu_1' + 2(\mu_1')^3
  • μ4=μ44μ3μ1+6μ2(μ1)23(μ1)4\mu_4 = \mu_4' - 4\mu_3'\mu_1' + 6\mu_2'(\mu_1')^2 - 3(\mu_1')^4

矩生成函数

原点矩可通过矩生成函数(MGF)统一生成。随机变量 XX 的 MGF 定义为 MX(t)=E[etX]M_X(t) = E[e^{tX}],在 t=0t=0 的邻域内收敛时,有:

MX(t)=k=0E[Xk]k!tk=k=0μkk!tkM_X(t) = \sum_{k=0}^\infty \frac{E[X^k]}{k!} t^k = \sum_{k=0}^\infty \frac{\mu_k'}{k!} t^k

因此,kk 阶原点矩可由 MGF 在 t=0t=0 处的 kk 阶导数求得:

μk=MX(k)(0)\mu_k' = M_X^{(k)}(0)

这一性质使得 MGF 成为求解各阶原点矩的系统性工具。例如,对于正态分布 N(μ,σ2)N(\mu, \sigma^2),其 MGF 为 M(t)=exp(μt+σ2t2/2)M(t) = \exp(\mu t + \sigma^2 t^2 / 2),由此可求得 μ1=μ\mu_1' = \muμ2=μ2+σ2\mu_2' = \mu^2 + \sigma^2μ3=μ3+3μσ2\mu_3' = \mu^3 + 3\mu\sigma^2 等。

常见分布的 k 阶原点矩

  • 伯努利分布 \Ber(p)\Ber(p)μk=p\mu_k' = p(所有阶相同)
  • 二项分布 \Bin(n,p)\Bin(n, p)μk=j=0kS(k,j)njpj\mu_k' = \sum_{j=0}^k S(k, j) \, n^{\underline{j}} \, p^j,其中 S(k,j)S(k,j)第二类斯特林数njn^{\underline{j}} 为下降阶乘
  • 泊松分布 \Pois(λ)\Pois(\lambda)μk=j=0kS(k,j)λj\mu_k' = \sum_{j=0}^k S(k, j) \, \lambda^j
  • 正态分布 N(μ,σ2)N(\mu, \sigma^2)μk=j=0k/2(k2j)(2j1)!!σ2jμk2j\mu_k' = \sum_{j=0}^{\lfloor k/2 \rfloor} \binom{k}{2j} (2j-1)!! \, \sigma^{2j} \mu^{k-2j}
  • 指数分布 \Exp(λ)\Exp(\lambda)μk=k!/λk\mu_k' = k! / \lambda^k
  • 均匀分布 U(a,b)U(a, b)μk=bk+1ak+1(k+1)(ba)\mu_k' = \frac{b^{k+1} - a^{k+1}}{(k+1)(b - a)}

应用

矩估计法

矩估计法(Method of Moments)由卡尔·皮尔逊(Karl Pearson)于1894年提出,是最早的系统性参数估计方法之一。其核心思想是将样本原点矩 μ^k=1ni=1nXik\hat{\mu}_k' = \frac{1}{n} \sum_{i=1}^n X_i^k 作为总体原点矩 μk\mu_k' 的估计量,通过建立样本矩等于总体矩的方程组来求解未知参数。矩估计量通常具有相合性(consistency),在大样本条件下收敛于真实参数值。

分布拟合检验

原点矩在分布拟合检验中用于评估样本数据与理论分布之间的匹配程度。通过比较样本原点矩与理论分布原点矩,可构造拟合优度检验统计量。矩生成函数的样本对应物——经验矩生成函数——也为分布识别提供了非参数工具。

风险度量与金融应用

金融经济学中,原点矩被用于投资组合的收益特征分析。均值(一阶原点矩)衡量预期收益,二阶原点矩(通过方差)衡量风险。资本资产定价模型(CAPM)和有效市场假说均以收益的一阶和二阶矩为核心假设。更高阶原点矩在风险管理中用于捕捉尾部风险——部分金融资产的收益分布具有厚尾特征,需通过四阶矩(峰度)加以刻画。

历史背景

矩的概念源自物理学中的力矩类比——将概率质量视为分布在实轴上的物理质量,则原点矩对应于各质量点到原点的距离加权和。雅各布·伯努利(Jacob Bernoulli)和亚伯拉罕·棣莫弗(Abraham de Moivre)在18世纪早期的工作中已隐含矩的思想。卡尔·皮尔逊在19世纪末系统发展了矩方法,并将其广泛应用于生物统计学进化论研究,推动了现代统计学的形成。罗纳德·费希尔(Ronald Fisher)在20世纪初进一步探讨了矩估计的渐近效率,指出在某些条件下最大似然估计(MLE)优于矩估计。