ARTICLE

边缘概率密度函数

边缘概率密度函数(Marginal Probability Density Function)是概率论与数理统计中的重要概念,用于描述多维随机变量中某个(或某些)分量的概率分布特性。在多维随机变量的联合分布已知的情况下,边缘概率密度函数通过对联合概率密度函数中无关变量进行积分得到,反映了单一随机变量在忽略其他变量影响下的分布规律。 定义 设二维连续型随机变量

浏览 3 更新 2025-10-26

边缘概率密度函数(Marginal Probability Density Function)是概率论与数理统计中的重要概念,用于描述多维随机变量中某个(或某些)分量的概率分布特性。在多维随机变量的联合分布已知的情况下,边缘概率密度函数通过对联合概率密度函数中无关变量进行积分得到,反映了单一随机变量在忽略其他变量影响下的分布规律。

定义

设二维连续型随机变量 (X,Y) (X, Y) 的联合概率密度函数为 fX,Y(x,y) f_{X,Y}(x, y) ,则 X X 的边缘概率密度函数定义为:

fX(x)=fX,Y(x,y)dyf_X(x) = \int_{-\infty}^{\infty} f_{X,Y}(x, y) \, dy

类似地,Y Y 的边缘概率密度函数为:

fY(y)=fX,Y(x,y)dxf_Y(y) = \int_{-\infty}^{\infty} f_{X,Y}(x, y) \, dx

对于 n n 维随机向量 (X1,X2,,Xn) (X_1, X_2, \dots, X_n) ,若需要得到其中某个分量 Xi X_i 的边缘分布,则需对联合概率密度函数关于其余 n1 n-1 个变量进行多重积分:

fXi(xi)=fX1,,Xn(x1,,xn)dx1dxi1dxi+1dxnf_{X_i}(x_i) = \int_{-\infty}^{\infty} \cdots \int_{-\infty}^{\infty} f_{X_1,\dots,X_n}(x_1,\dots,x_n) \, dx_1 \cdots dx_{i-1} dx_{i+1} \cdots dx_n

直观理解

边缘概率密度函数的名称来源于概率表中的"边缘"计算方式。在离散情形下,联合概率分布表的行和或列和通常写在表格的边缘位置,由此得名"边缘分布"。连续情形下这一名称得以沿用。边缘概率密度函数本质上是将联合分布中除目标变量外的所有不确定性通过积分"积分掉",使得研究者可以聚焦于单一变量的概率行为。

性质

  1. 非负性fX(x)0 f_X(x) \geq 0 对所有 x x 成立。
  2. 归一性fX(x)dx=1 \int_{-\infty}^{\infty} f_X(x) \, dx = 1
  3. 与联合分布的关系:联合分布唯一决定边缘分布,但边缘分布不能唯一决定联合分布——不同的联合分布可能具有相同的边缘分布。
  4. 与条件分布的关系:边缘分布、条件分布与联合分布之间存在如下关系:
fX,Y(x,y)=fXY(xy)fY(y)=fYX(yx)fX(x)f_{X,Y}(x, y) = f_{X|Y}(x|y) \cdot f_Y(y) = f_{Y|X}(y|x) \cdot f_X(x)

经典示例

示例一:均匀分布

(X,Y) (X, Y) 在矩形区域 [0,1]×[0,2] [0,1] \times [0,2] 上服从均匀分布,联合概率密度函数为:

f_{X,Y}(x, y) = \begin{cases} \frac{1}{2}, & 0 \leq x \leq 1,\ 0 \leq y \leq 2 \\

0, \& 其他\text{其他}

\end{cases}

X X 的边缘概率密度函数为:

fX(x)=0212dy=1,0x1f_X(x) = \int_{0}^{2} \frac{1}{2} \, dy = 1, \quad 0 \leq x \leq 1

X X [0,1] [0,1] 上服从均匀分布。Y Y 的边缘概率密度函数为:

fY(y)=0112dx=12,0y2f_Y(y) = \int_{0}^{1} \frac{1}{2} \, dx = \frac{1}{2}, \quad 0 \leq y \leq 2

Y Y [0,2] [0,2] 上服从均匀分布。

示例二:二元正态分布

(X,Y) (X, Y) 服从二元正态分布 N(μX,μY,σX2,σY2,ρ) N(\mu_X, \mu_Y, \sigma_X^2, \sigma_Y^2, \rho) ,其联合概率密度函数为:

fX,Y(x,y)=12πσXσY1ρ2exp{12(1ρ2)[(xμX)2σX22ρ(xμX)(yμY)σXσY+(yμY)2σY2]}f_{X,Y}(x, y) = \frac{1}{2\pi\sigma_X\sigma_Y\sqrt{1-\rho^2}} \exp\left\{-\frac{1}{2(1-\rho^2)}\left[\frac{(x-\mu_X)^2}{\sigma_X^2} - 2\rho\frac{(x-\mu_X)(y-\mu_Y)}{\sigma_X\sigma_Y} + \frac{(y-\mu_Y)^2}{\sigma_Y^2}\right]\right\}

通过对 y y 积分可得 X X 的边缘分布为正态分布 N(μX,σX2) N(\mu_X, \sigma_X^2) ,同理 Y Y 的边缘分布为 N(μY,σY2) N(\mu_Y, \sigma_Y^2) 。这表明二元正态分布的边缘分布仍为正态分布,且边缘分布的参数与相关系数 ρ \rho 无关。

应用

边缘概率密度函数在统计学、机器学习、信号处理等领域有广泛应用。在贝叶斯统计中,证据因子(边际似然)的计算涉及对参数的边缘化;在隐变量模型中,EM算法通过边缘化隐变量来估计参数;在图像处理中,边缘分布用于描述像素值的整体统计特性。边缘概率密度函数也是计算条件概率、协方差和相关系数等统计量的基础工具。

参考文献

  1. Casella, G., \& Berger, R. L. (2002). *Statistical Inference* (2nd ed.). Duxbury Press.
  2. 陈希孺. (2009). *概率论与数理统计*. 中国科学技术大学出版社.
  3. Wasserman, L. (2004). *All of Statistics: A Concise Course in Statistical Inference*. Springer.