ARTICLE

联合概率

联合概率 (Joint Probability) 联合概率(Joint Probability)是概率论中最基本的概念之一,描述两个或多个随机变量同时取特定值的概率。它是构建多元概率模型、理解变量间依赖关系的出发点,也是条件概率、贝叶斯定理、协方差和相关性分析等更复杂概念的基础。在经济学和计量经济学中,联合概率分布是刻画多个经济指标(如通货膨胀率与失业率、资

浏览 4 更新 2025-10-26

联合概率 (Joint Probability)

联合概率(Joint Probability)是概率论中最基本的概念之一,描述两个或多个随机变量同时取特定值的概率。它是构建多元概率模型、理解变量间依赖关系的出发点,也是条件概率贝叶斯定理协方差相关性分析等更复杂概念的基础。在经济学和计量经济学中,联合概率分布是刻画多个经济指标(如通货膨胀率与失业率、资产收益率与市场指数)协同变动模式的数学语言。

离散型联合分布

对于两个离散随机变量 XXYY,其联合概率质量函数(Joint PMF)定义为:

pX,Y(x,y)=P(X=x,Y=y)p_{X,Y}(x, y) = P(X = x, Y = y)

满足两条基本公理:

pX,Y(x,y)0,xypX,Y(x,y)=1p_{X,Y}(x, y) \ge 0, \qquad \sum_x \sum_y p_{X,Y}(x, y) = 1

联合概率质量函数常以列联表(Contingency Table)形式呈现,行对应 XX 的取值,列对应 YY 的取值,单元格内的数值即为联合概率。例如,描述教育水平(高/低)与收入水平(高/中/低)的联合分布,可清晰展现两者的统计关联。

连续型联合分布

XXYY 为连续随机变量,则用联合概率密度函数(Joint PDF)fX,Y(x,y)f_{X,Y}(x, y) 来描述。概率由积分给出:

P(aXb,cYd)=abcdfX,Y(x,y)dydxP(a \le X \le b, c \le Y \le d) = \int_{a}^{b} \int_{c}^{d} f_{X,Y}(x, y) \, dy \, dx

密度函数满足非负性和归一化条件:

fX,Y(x,y)0,fX,Y(x,y)dxdy=1f_{X,Y}(x, y) \ge 0, \qquad \int_{-\infty}^{\infty} \int_{-\infty}^{\infty} f_{X,Y}(x, y) \, dx \, dy = 1

最常见的连续联合分布是二维正态分布(Bivariate Normal Distribution),其联合PDF完全由均值 μX,μY\mu_X, \mu_Y、方差 σX2,σY2\sigma_X^2, \sigma_Y^2相关系数 ρ\rho 五个参数决定:

f(x,y)=12πσXσY1ρ2exp ⁣(12(1ρ2) ⁣[(xμX)2σX22ρ(xμX)(yμY)σXσY+(yμY)2σY2])f(x, y) = \frac{1}{2\pi\sigma_X\sigma_Y\sqrt{1-\rho^2}} \exp\!\left( -\frac{1}{2(1-\rho^2)}\!\left[ \frac{(x-\mu_X)^2}{\sigma_X^2} - 2\rho\frac{(x-\mu_X)(y-\mu_Y)}{\sigma_X\sigma_Y} + \frac{(y-\mu_Y)^2}{\sigma_Y^2} \right] \right)

边际概率与条件概率

从联合分布可以派生出两个核心概念:

边际概率(Marginal Probability):通过对联合分布中另一个变量求和(离散)或积分(连续)获得。对于离散情形:

P(X=x)=ypX,Y(x,y),P(Y=y)=xpX,Y(x,y)P(X = x) = \sum_y p_{X,Y}(x, y), \qquad P(Y = y) = \sum_x p_{X,Y}(x, y)

对于连续情形:

fX(x)=fX,Y(x,y)dy,fY(y)=fX,Y(x,y)dxf_X(x) = \int_{-\infty}^{\infty} f_{X,Y}(x, y) \, dy, \qquad f_Y(y) = \int_{-\infty}^{\infty} f_{X,Y}(x, y) \, dx

条件概率(Conditional Probability):在已知某变量取值的条件下,另一变量的概率分布:

P(Y=yX=x)=P(X=x,Y=y)P(X=x)=pX,Y(x,y)pX(x)(要求 pX(x)>0)P(Y = y \mid X = x) = \frac{P(X = x, Y = y)}{P(X = x)} = \frac{p_{X,Y}(x, y)}{p_X(x)} \quad (\text{要求 } p_X(x) > 0)

连续情形下,条件密度为 fYX(yx)=fX,Y(x,y)/fX(x)f_{Y\mid X}(y \mid x) = f_{X,Y}(x, y) / f_X(x)。条件概率是贝叶斯定理的核心构件,也是回归分析的理论基础——条件期望 E[YX=x]E[Y \mid X = x] 正是回归函数的数学定义。

独立性与协方差

随机变量 XXYY 被称为相互独立,当且仅当联合分布等于边际分布之积:

pX,Y(x,y)=pX(x)pY(y)fX,Y(x,y)=fX(x)fY(y)p_{X,Y}(x, y) = p_X(x) \, p_Y(y) \quad \text{或} \quad f_{X,Y}(x, y) = f_X(x) \, f_Y(y)

独立性意味着一个变量的取值不提供关于另一个变量的任何信息。判断独立性的常用途径是通过协方差

Cov(X,Y)=E[(XE[X])(YE[Y])]=E[XY]E[X]E[Y]\operatorname{Cov}(X, Y) = E[(X - E[X])(Y - E[Y])] = E[XY] - E[X]E[Y]

协方差为零是独立的必要条件(非充分条件)。将协方差标准化即得皮尔逊相关系数

ρX,Y=Cov(X,Y)σXσY[1,1]\rho_{X,Y} = \frac{\operatorname{Cov}(X, Y)}{\sigma_X \sigma_Y} \in [-1, 1]

经济学与计量经济学中的应用

联合概率分布在经济学中有广泛的实际应用。在金融经济学中,多维资产收益率的联合分布是现代投资组合理论(Modern Portfolio Theory)的基石——马科维茨均值-方差模型完全依赖资产间收益率的协方差矩阵来构建有效前沿。在计量经济学中,联立方程模型向量自回归(VAR)的设定均以变量的联合分布为出发点。观测数据的似然函数本质上就是所有观测的联合概率密度,在极大似然估计(MLE)中,通过最大化联合似然函数来估计模型参数。此外,连接函数(Copula)将各变量的边际分布与它们的联合分布解耦,广泛应用于信用风险建模和资产相关性分析中——这是联合概率思想在当代金融工程中的直接延伸。