原点矩 (Raw Moment)
原点矩 (raw moment),又称粗矩 ,是概率论 与数理统计 中描述概率分布 数值特征的一类基本统计量。对于随机变量 X X X ,其关于原点 0 0 0 的 k k k 阶矩定义为 μ k ′ = E [ X k ] \mu_k' = E[X^k] μ k ′ = E [ X k ] ,即随机变量 k k k 次幂的期望 。原点矩是矩 (moment)概念中最基础的形式,与之相对的是中心矩 (central moment),后者描述随机变量偏离其均值的程度。原点矩与中心矩共同构成了矩理论的核心框架,在分布拟合 、参数估计 (如矩估计法 )和假设检验 中具有广泛应用。
定义与分类
设 X X X 为一随机变量,其 k k k 阶原点矩定义为:
μ k ′ = E [ X k ] = { ∑ i x i k p ( x i ) , X 为离散型随机变量 ∫ − ∞ ∞ x k f ( x ) d x , X 为连续型随机变量 \mu_k' = E[X^k] =
\begin{cases}
\sum_i x_i^k \, p(x_i), & X \text{ 为离散型随机变量} \\
\int_{-\infty}^{\infty} x^k \, f(x) \, dx, & X \text{ 为连续型随机变量}
\end{cases} μ k ′ = E [ X k ] = { ∑ i x i k p ( x i ) , ∫ − ∞ ∞ x k f ( x ) d x , X 为离散型随机变量 X 为连续型随机变量
其中 p ( x i ) p(x_i) p ( x i ) 为离散型随机变量的概率质量函数 (PMF),f ( x ) f(x) f ( x ) 为连续型随机变量的概率密度函数 (PDF)。前提条件是上述积分或级数绝对收敛 。各阶原点矩各有其统计含义:
一阶原点矩 μ 1 ′ = E [ X ] \mu_1' = E[X] μ 1 ′ = E [ X ] :即随机变量的均值 (mean),是分布的中心位置度量,反映数据的集中趋势。二阶原点矩 μ 2 ′ = E [ X 2 ] \mu_2' = E[X^2] μ 2 ′ = E [ X 2 ] :与方差 的关系为 Var ( X ) = μ 2 ′ − ( μ 1 ′ ) 2 \Var(X) = \mu_2' - (\mu_1')^2 Var ( X ) = μ 2 ′ − ( μ 1 ′ ) 2 ,是计算方差和标准差 的基础。三阶原点矩 μ 3 ′ = E [ X 3 ] \mu_3' = E[X^3] μ 3 ′ = E [ X 3 ] :用于计算偏度 (skewness),衡量分布的非对称性。四阶原点矩 μ 4 ′ = E [ X 4 ] \mu_4' = E[X^4] μ 4 ′ = E [ X 4 ] :用于计算峰度 (kurtosis),衡量分布的尾部厚度和峰态。
原点矩与中心矩的关系
中心矩 定义为 μ k = E [ ( X − μ ) k ] \mu_k = E[(X - \mu)^k] μ k = E [( X − μ ) k ] ,其中 μ = E [ X ] \mu = E[X] μ = E [ X ] 。二者可通过二项式定理 相互转换。将 ( X − μ ) k (X - \mu)^k ( X − μ ) k 展开:
μ k = E [ ( X − μ ) k ] = ∑ j = 0 k ( k j ) E [ X k − j ] ( − μ ) j = ∑ j = 0 k ( k j ) μ k − j ′ ( − μ 1 ′ ) j \mu_k = E[(X - \mu)^k] = \sum_{j=0}^k \binom{k}{j} E[X^{k-j}] (-\mu)^{j} = \sum_{j=0}^k \binom{k}{j} \mu_{k-j}' (-\mu_1')^{j} μ k = E [( X − μ ) k ] = j = 0 ∑ k ( j k ) E [ X k − j ] ( − μ ) j = j = 0 ∑ k ( j k ) μ k − j ′ ( − μ 1 ′ ) j
反过来,原点矩也可由中心矩表示:
μ k ′ = E [ ( μ + ( X − μ ) ) k ] = ∑ j = 0 k ( k j ) μ k − j μ j \mu_k' = E[(\mu + (X - \mu))^k] = \sum_{j=0}^k \binom{k}{j} \mu^{k-j} \mu_j μ k ′ = E [( μ + ( X − μ ) ) k ] = j = 0 ∑ k ( j k ) μ k − j μ j
其中 μ 0 ′ = μ 0 = 1 \mu_0' = \mu_0 = 1 μ 0 ′ = μ 0 = 1 为约定。据此,低阶矩的具体转换关系为:
μ 1 = 0 \mu_1 = 0 μ 1 = 0 (一阶中心矩恒为零)μ 2 = μ 2 ′ − ( μ 1 ′ ) 2 \mu_2 = \mu_2' - (\mu_1')^2 μ 2 = μ 2 ′ − ( μ 1 ′ ) 2 (方差)μ 3 = μ 3 ′ − 3 μ 2 ′ μ 1 ′ + 2 ( μ 1 ′ ) 3 \mu_3 = \mu_3' - 3\mu_2'\mu_1' + 2(\mu_1')^3 μ 3 = μ 3 ′ − 3 μ 2 ′ μ 1 ′ + 2 ( μ 1 ′ ) 3 μ 4 = μ 4 ′ − 4 μ 3 ′ μ 1 ′ + 6 μ 2 ′ ( μ 1 ′ ) 2 − 3 ( μ 1 ′ ) 4 \mu_4 = \mu_4' - 4\mu_3'\mu_1' + 6\mu_2'(\mu_1')^2 - 3(\mu_1')^4 μ 4 = μ 4 ′ − 4 μ 3 ′ μ 1 ′ + 6 μ 2 ′ ( μ 1 ′ ) 2 − 3 ( μ 1 ′ ) 4
矩生成函数
原点矩可通过矩生成函数 (MGF)统一生成。随机变量 X X X 的 MGF 定义为 M X ( t ) = E [ e t X ] M_X(t) = E[e^{tX}] M X ( t ) = E [ e tX ] ,在 t = 0 t=0 t = 0 的邻域内收敛时,有:
M X ( t ) = ∑ k = 0 ∞ E [ X k ] k ! t k = ∑ k = 0 ∞ μ k ′ k ! t k M_X(t) = \sum_{k=0}^\infty \frac{E[X^k]}{k!} t^k = \sum_{k=0}^\infty \frac{\mu_k'}{k!} t^k M X ( t ) = k = 0 ∑ ∞ k ! E [ X k ] t k = k = 0 ∑ ∞ k ! μ k ′ t k
因此,k k k 阶原点矩可由 MGF 在 t = 0 t=0 t = 0 处的 k k k 阶导数求得:
μ k ′ = M X ( k ) ( 0 ) \mu_k' = M_X^{(k)}(0) μ k ′ = M X ( k ) ( 0 )
这一性质使得 MGF 成为求解各阶原点矩的系统性工具。例如,对于正态分布 N ( μ , σ 2 ) N(\mu, \sigma^2) N ( μ , σ 2 ) ,其 MGF 为 M ( t ) = exp ( μ t + σ 2 t 2 / 2 ) M(t) = \exp(\mu t + \sigma^2 t^2 / 2) M ( t ) = exp ( μ t + σ 2 t 2 /2 ) ,由此可求得 μ 1 ′ = μ \mu_1' = \mu μ 1 ′ = μ ,μ 2 ′ = μ 2 + σ 2 \mu_2' = \mu^2 + \sigma^2 μ 2 ′ = μ 2 + σ 2 ,μ 3 ′ = μ 3 + 3 μ σ 2 \mu_3' = \mu^3 + 3\mu\sigma^2 μ 3 ′ = μ 3 + 3 μ σ 2 等。
常见分布的 k 阶原点矩
伯努利分布 \Ber ( p ) \Ber(p) \Ber ( p ) :μ k ′ = p \mu_k' = p μ k ′ = p (所有阶相同)二项分布 \Bin ( n , p ) \Bin(n, p) \Bin ( n , p ) :μ k ′ = ∑ j = 0 k S ( k , j ) n j ‾ p j \mu_k' = \sum_{j=0}^k S(k, j) \, n^{\underline{j}} \, p^j μ k ′ = ∑ j = 0 k S ( k , j ) n j p j ,其中 S ( k , j ) S(k,j) S ( k , j ) 为第二类斯特林数 ,n j ‾ n^{\underline{j}} n j 为下降阶乘泊松分布 \Pois ( λ ) \Pois(\lambda) \Pois ( λ ) :μ k ′ = ∑ j = 0 k S ( k , j ) λ j \mu_k' = \sum_{j=0}^k S(k, j) \, \lambda^j μ k ′ = ∑ j = 0 k S ( k , j ) λ j 正态分布 N ( μ , σ 2 ) N(\mu, \sigma^2) N ( μ , σ 2 ) :μ k ′ = ∑ j = 0 ⌊ k / 2 ⌋ ( k 2 j ) ( 2 j − 1 ) ! ! σ 2 j μ k − 2 j \mu_k' = \sum_{j=0}^{\lfloor k/2 \rfloor} \binom{k}{2j} (2j-1)!! \, \sigma^{2j} \mu^{k-2j} μ k ′ = ∑ j = 0 ⌊ k /2 ⌋ ( 2 j k ) ( 2 j − 1 )!! σ 2 j μ k − 2 j 指数分布 \Exp ( λ ) \Exp(\lambda) \Exp ( λ ) :μ k ′ = k ! / λ k \mu_k' = k! / \lambda^k μ k ′ = k ! / λ k 均匀分布 U ( a , b ) U(a, b) U ( a , b ) :μ k ′ = b k + 1 − a k + 1 ( k + 1 ) ( b − a ) \mu_k' = \frac{b^{k+1} - a^{k+1}}{(k+1)(b - a)} μ k ′ = ( k + 1 ) ( b − a ) b k + 1 − a k + 1
应用
矩估计法
矩估计法 (Method of Moments)由卡尔·皮尔逊 (Karl Pearson)于1894年提出,是最早的系统性参数估计 方法之一。其核心思想是将样本原点矩 μ ^ k ′ = 1 n ∑ i = 1 n X i k \hat{\mu}_k' = \frac{1}{n} \sum_{i=1}^n X_i^k μ ^ k ′ = n 1 ∑ i = 1 n X i k 作为总体原点矩 μ k ′ \mu_k' μ k ′ 的估计量,通过建立样本矩等于总体矩的方程组来求解未知参数。矩估计量通常具有相合性 (consistency),在大样本条件下收敛于真实参数值。
分布拟合检验
原点矩在分布拟合检验 中用于评估样本数据与理论分布之间的匹配程度。通过比较样本原点矩与理论分布原点矩,可构造拟合优度检验 统计量。矩生成函数 的样本对应物——经验矩生成函数 ——也为分布识别提供了非参数工具。
风险度量与金融应用
在金融经济学 中,原点矩被用于投资组合 的收益特征分析。均值(一阶原点矩)衡量预期收益,二阶原点矩(通过方差)衡量风险。资本资产定价模型 (CAPM)和有效市场假说 均以收益的一阶和二阶矩为核心假设。更高阶原点矩在风险管理 中用于捕捉尾部风险 ——部分金融资产的收益分布具有厚尾 特征,需通过四阶矩(峰度)加以刻画。
历史背景
矩的概念源自物理学 中的力矩 类比——将概率质量视为分布在实轴上的物理质量,则原点矩对应于各质量点到原点的距离加权和。雅各布·伯努利 (Jacob Bernoulli)和亚伯拉罕·棣莫弗 (Abraham de Moivre)在18世纪早期的工作中已隐含矩的思想。卡尔·皮尔逊 在19世纪末系统发展了矩方法,并将其广泛应用于生物统计学 和进化论 研究,推动了现代统计学的形成。罗纳德·费希尔 (Ronald Fisher)在20世纪初进一步探讨了矩估计的渐近效率 ,指出在某些条件下最大似然估计 (MLE)优于矩估计。
关于知经 KNOWECON
知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌,长期面向北京大学、清华大学、中国人民大学等顶尖院校,提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考,并成功进入理想院校。
知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业,获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者,长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。
我们相信,好的考研辅导不只是押题和陪跑,更是把复杂知识讲清楚、把复习路径设计清楚,并用技术让学习过程更可追踪、更可反馈、更可坚持。