联合分布 (Joint Distribution)
联合分布 (Joint Distribution) 是概率论 与数理统计 中的核心概念,描述两个或多个随机变量 同时取值的概率规律。形式上,设 X X X 和 Y Y Y 为定义在同一概率空间 上的两个随机变量,二者的联合分布完全刻画了它们之间的概率依赖关系,包括独立性 、相关性 以及各种协同变化模式。
联合分布函数
对于随机变量 X X X 和 Y Y Y ,联合累积分布函数定义为:
F X , Y ( x , y ) = P ( X ≤ x , Y ≤ y ) F_{X,Y}(x, y) = P(X \le x, Y \le y) F X , Y ( x , y ) = P ( X ≤ x , Y ≤ y )
该函数满足四条基本性质:对每个自变量单调非减;当任一自变量趋于 − ∞ -\infty − ∞ 时函数趋于零;当两个自变量均趋于 + ∞ +\infty + ∞ 时函数趋于1;F F F 对每个自变量右连续。
从联合CDF可推导出边缘分布 :F X ( x ) = lim y → ∞ F X , Y ( x , y ) F_X(x) = \lim_{y \to \infty} F_{X,Y}(x, y) F X ( x ) = lim y → ∞ F X , Y ( x , y ) 以及 F Y ( y ) = lim x → ∞ F X , Y ( x , y ) F_Y(y) = \lim_{x \to \infty} F_{X,Y}(x, y) F Y ( y ) = lim x → ∞ F X , Y ( x , y ) 。
离散型与连续型联合分布
对于离散型 随机变量,联合概率质量函数为:
p X , Y ( x , y ) = P ( X = x , Y = y ) p_{X,Y}(x, y) = P(X = x, Y = y) p X , Y ( x , y ) = P ( X = x , Y = y )
满足非负性和归一性 ∑ x ∑ y p X , Y ( x , y ) = 1 \sum_x \sum_y p_{X,Y}(x, y) = 1 ∑ x ∑ y p X , Y ( x , y ) = 1 。边缘PMF通过对另一方求和得到:p X ( x ) = ∑ y p X , Y ( x , y ) p_X(x) = \sum_y p_{X,Y}(x, y) p X ( x ) = ∑ y p X , Y ( x , y ) 。
对于连续型 随机变量,联合概率密度函数 f X , Y ( x , y ) f_{X,Y}(x, y) f X , Y ( x , y ) 满足:
P ( a ≤ X ≤ b , c ≤ Y ≤ d ) = ∫ a b ∫ c d f X , Y ( x , y ) d y d x P(a \le X \le b, c \le Y \le d) = \int_a^b \int_c^d f_{X,Y}(x, y) \, dy \, dx P ( a ≤ X ≤ b , c ≤ Y ≤ d ) = ∫ a b ∫ c d f X , Y ( x , y ) d y d x
且在全空间上的二重积分等于1。边缘PDF为 f X ( x ) = ∫ − ∞ ∞ f X , Y ( x , y ) d y f_X(x) = \int_{-\infty}^{\infty} f_{X,Y}(x, y) \, dy f X ( x ) = ∫ − ∞ ∞ f X , Y ( x , y ) d y 。
独立性与条件分布
两个随机变量独立 当且仅当联合分布可分解为边缘分布的乘积:
f X , Y ( x , y ) = f X ( x ) ⋅ f Y ( y ) f_{X,Y}(x, y) = f_X(x) \cdot f_Y(y) f X , Y ( x , y ) = f X ( x ) ⋅ f Y ( y )
独立意味着知道 X X X 的取值不能提供关于 Y Y Y 的任何信息。
条件分布 刻画了在已知一个变量取值下另一个变量的分布。离散情形下条件PMF为 p Y ∣ X ( y ∣ x ) = p X , Y ( x , y ) / p X ( x ) p_{Y|X}(y|x) = p_{X,Y}(x, y) / p_X(x) p Y ∣ X ( y ∣ x ) = p X , Y ( x , y ) / p X ( x ) 。连续情形下条件PDF为 f Y ∣ X ( y ∣ x ) = f X , Y ( x , y ) / f X ( x ) f_{Y|X}(y|x) = f_{X,Y}(x, y) / f_X(x) f Y ∣ X ( y ∣ x ) = f X , Y ( x , y ) / f X ( x ) 。由条件分布可进一步定义条件期望 和条件方差 。
协方差与相关系数
联合分布包含了变量间线性相关程度的信息。协方差 定义为:
Cov ( X , Y ) = E [ ( X − E X ) ( Y − E Y ) ] = E [ X Y ] − E X ⋅ E Y \operatorname{Cov}(X, Y) = \mathbb{E}[(X - \mathbb{E}X)(Y - \mathbb{E}Y)] = \mathbb{E}[XY] - \mathbb{E}X \cdot \mathbb{E}Y Cov ( X , Y ) = E [( X − E X ) ( Y − E Y )] = E [ X Y ] − E X ⋅ E Y
将协方差标准化即得相关系数 ρ X , Y = Cov ( X , Y ) / ( σ X σ Y ) \rho_{X,Y} = \operatorname{Cov}(X, Y) / (\sigma_X \sigma_Y) ρ X , Y = Cov ( X , Y ) / ( σ X σ Y ) ,取值范围为 [ − 1 , 1 ] [-1, 1] [ − 1 , 1 ] 。
多元推广
对于 n n n 个随机变量,联合分布推广为多元联合分布函数。最重要的特例是多元正态分布 ,其联合PDF由均值向量 μ \boldsymbol{\mu} μ 和协方差矩阵 Σ \boldsymbol{\Sigma} Σ 完全确定:
f ( x ) = 1 ( 2 π ) n / 2 ∣ Σ ∣ 1 / 2 exp ( − 1 2 ( x − μ ) T Σ − 1 ( x − μ ) ) f(\mathbf{x}) = \frac{1}{(2\pi)^{n/2} |\boldsymbol{\Sigma}|^{1/2}} \exp\left(-\frac{1}{2} (\mathbf{x} - \boldsymbol{\mu})^T \boldsymbol{\Sigma}^{-1} (\mathbf{x} - \boldsymbol{\mu})\right) f ( x ) = ( 2 π ) n /2 ∣ Σ ∣ 1/2 1 exp ( − 2 1 ( x − μ ) T Σ − 1 ( x − μ ) )
联合分布在计量经济学 (联合假设检验)、贝叶斯统计 (联合后验分布)、金融风险管理 (资产收益的联合尾部行为)以及机器学习 领域均有广泛应用。
关于知经 KNOWECON
知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌,长期面向北京大学、清华大学、中国人民大学等顶尖院校,提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考,并成功进入理想院校。
知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业,获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者,长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。
我们相信,好的考研辅导不只是押题和陪跑,更是把复杂知识讲清楚、把复习路径设计清楚,并用技术让学习过程更可追踪、更可反馈、更可坚持。