边缘概率密度函数 (Marginal Probability Density Function)是概率论与数理统计中的重要概念,用于描述多维随机变量中某个(或某些)分量的概率分布特性。在多维随机变量的联合分布已知的情况下,边缘概率密度函数通过对联合概率密度函数中无关变量进行积分得到,反映了单一随机变量在忽略其他变量影响下的分布规律。
定义
设二维连续型随机变量 ( X , Y ) (X, Y) ( X , Y ) 的联合概率密度函数为 f X , Y ( x , y ) f_{X,Y}(x, y) f X , Y ( x , y ) ,则 X X X 的边缘概率密度函数定义为:
f X ( x ) = ∫ − ∞ ∞ f X , Y ( x , y ) d y f_X(x) = \int_{-\infty}^{\infty} f_{X,Y}(x, y) \, dy f X ( x ) = ∫ − ∞ ∞ f X , Y ( x , y ) d y
类似地,Y Y Y 的边缘概率密度函数为:
f Y ( y ) = ∫ − ∞ ∞ f X , Y ( x , y ) d x f_Y(y) = \int_{-\infty}^{\infty} f_{X,Y}(x, y) \, dx f Y ( y ) = ∫ − ∞ ∞ f X , Y ( x , y ) d x
对于 n n n 维随机向量 ( X 1 , X 2 , … , X n ) (X_1, X_2, \dots, X_n) ( X 1 , X 2 , … , X n ) ,若需要得到其中某个分量 X i X_i X i 的边缘分布,则需对联合概率密度函数关于其余 n − 1 n-1 n − 1 个变量进行多重积分:
f X i ( x i ) = ∫ − ∞ ∞ ⋯ ∫ − ∞ ∞ f X 1 , … , X n ( x 1 , … , x n ) d x 1 ⋯ d x i − 1 d x i + 1 ⋯ d x n f_{X_i}(x_i) = \int_{-\infty}^{\infty} \cdots \int_{-\infty}^{\infty} f_{X_1,\dots,X_n}(x_1,\dots,x_n) \, dx_1 \cdots dx_{i-1} dx_{i+1} \cdots dx_n f X i ( x i ) = ∫ − ∞ ∞ ⋯ ∫ − ∞ ∞ f X 1 , … , X n ( x 1 , … , x n ) d x 1 ⋯ d x i − 1 d x i + 1 ⋯ d x n
直观理解
边缘概率密度函数的名称来源于概率表中的"边缘"计算方式。在离散情形下,联合概率分布表的行和或列和通常写在表格的边缘位置,由此得名"边缘分布"。连续情形下这一名称得以沿用。边缘概率密度函数本质上是将联合分布中除目标变量外的所有不确定性通过积分"积分掉",使得研究者可以聚焦于单一变量的概率行为。
性质
非负性 :f X ( x ) ≥ 0 f_X(x) \geq 0 f X ( x ) ≥ 0 对所有 x x x 成立。归一性 :∫ − ∞ ∞ f X ( x ) d x = 1 \int_{-\infty}^{\infty} f_X(x) \, dx = 1 ∫ − ∞ ∞ f X ( x ) d x = 1 。与联合分布的关系 :联合分布唯一决定边缘分布,但边缘分布不能唯一决定联合分布——不同的联合分布可能具有相同的边缘分布。与条件分布的关系 :边缘分布、条件分布与联合分布之间存在如下关系:
f X , Y ( x , y ) = f X ∣ Y ( x ∣ y ) ⋅ f Y ( y ) = f Y ∣ X ( y ∣ x ) ⋅ f X ( x ) f_{X,Y}(x, y) = f_{X|Y}(x|y) \cdot f_Y(y) = f_{Y|X}(y|x) \cdot f_X(x) f X , Y ( x , y ) = f X ∣ Y ( x ∣ y ) ⋅ f Y ( y ) = f Y ∣ X ( y ∣ x ) ⋅ f X ( x )
经典示例
示例一:均匀分布
设 ( X , Y ) (X, Y) ( X , Y ) 在矩形区域 [ 0 , 1 ] × [ 0 , 2 ] [0,1] \times [0,2] [ 0 , 1 ] × [ 0 , 2 ] 上服从均匀分布,联合概率密度函数为:
f_{X,Y}(x, y) = \begin{cases}
\frac{1}{2}, & 0 \leq x \leq 1,\ 0 \leq y \leq 2 \\
0, \& 其他 \text{其他} 其他
\end{cases}
则 X X X 的边缘概率密度函数为:
f X ( x ) = ∫ 0 2 1 2 d y = 1 , 0 ≤ x ≤ 1 f_X(x) = \int_{0}^{2} \frac{1}{2} \, dy = 1, \quad 0 \leq x \leq 1 f X ( x ) = ∫ 0 2 2 1 d y = 1 , 0 ≤ x ≤ 1
即 X X X 在 [ 0 , 1 ] [0,1] [ 0 , 1 ] 上服从均匀分布。Y Y Y 的边缘概率密度函数为:
f Y ( y ) = ∫ 0 1 1 2 d x = 1 2 , 0 ≤ y ≤ 2 f_Y(y) = \int_{0}^{1} \frac{1}{2} \, dx = \frac{1}{2}, \quad 0 \leq y \leq 2 f Y ( y ) = ∫ 0 1 2 1 d x = 2 1 , 0 ≤ y ≤ 2
即 Y Y Y 在 [ 0 , 2 ] [0,2] [ 0 , 2 ] 上服从均匀分布。
示例二:二元正态分布
设 ( X , Y ) (X, Y) ( X , Y ) 服从二元正态分布 N ( μ X , μ Y , σ X 2 , σ Y 2 , ρ ) N(\mu_X, \mu_Y, \sigma_X^2, \sigma_Y^2, \rho) N ( μ X , μ Y , σ X 2 , σ Y 2 , ρ ) ,其联合概率密度函数为:
f X , Y ( x , y ) = 1 2 π σ X σ Y 1 − ρ 2 exp { − 1 2 ( 1 − ρ 2 ) [ ( x − μ X ) 2 σ X 2 − 2 ρ ( x − μ X ) ( y − μ Y ) σ X σ Y + ( y − μ Y ) 2 σ Y 2 ] } f_{X,Y}(x, y) = \frac{1}{2\pi\sigma_X\sigma_Y\sqrt{1-\rho^2}} \exp\left\{-\frac{1}{2(1-\rho^2)}\left[\frac{(x-\mu_X)^2}{\sigma_X^2} - 2\rho\frac{(x-\mu_X)(y-\mu_Y)}{\sigma_X\sigma_Y} + \frac{(y-\mu_Y)^2}{\sigma_Y^2}\right]\right\} f X , Y ( x , y ) = 2 π σ X σ Y 1 − ρ 2 1 exp { − 2 ( 1 − ρ 2 ) 1 [ σ X 2 ( x − μ X ) 2 − 2 ρ σ X σ Y ( x − μ X ) ( y − μ Y ) + σ Y 2 ( y − μ Y ) 2 ] }
通过对 y y y 积分可得 X X X 的边缘分布为正态分布 N ( μ X , σ X 2 ) N(\mu_X, \sigma_X^2) N ( μ X , σ X 2 ) ,同理 Y Y Y 的边缘分布为 N ( μ Y , σ Y 2 ) N(\mu_Y, \sigma_Y^2) N ( μ Y , σ Y 2 ) 。这表明二元正态分布的边缘分布仍为正态分布,且边缘分布的参数与相关系数 ρ \rho ρ 无关。
应用
边缘概率密度函数在统计学、机器学习、信号处理等领域有广泛应用。在贝叶斯统计中,证据因子(边际似然)的计算涉及对参数的边缘化;在隐变量模型中,EM算法通过边缘化隐变量来估计参数;在图像处理中,边缘分布用于描述像素值的整体统计特性。边缘概率密度函数也是计算条件概率、协方差和相关系数等统计量的基础工具。
参考文献
Casella, G., \& Berger, R. L. (2002). *Statistical Inference* (2nd ed.). Duxbury Press. 陈希孺. (2009). *概率论与数理统计*. 中国科学技术大学出版社. Wasserman, L. (2004). *All of Statistics: A Concise Course in Statistical Inference*. Springer.
关于知经 KNOWECON
知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌,长期面向北京大学、清华大学、中国人民大学等顶尖院校,提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考,并成功进入理想院校。
知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业,获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者,长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。
我们相信,好的考研辅导不只是押题和陪跑,更是把复杂知识讲清楚、把复习路径设计清楚,并用技术让学习过程更可追踪、更可反馈、更可坚持。