ARTICLE

概率函数

概率函数 (Probability Function) 概率函数是概率论中的核心概念,用于以数学形式精确描述一个随机变量取各个可能值的概率分布规律。根据随机变量的类型——离散或连续——概率函数表现为不同的数学形式:概率质量函数(Probability Mass Function, PMF)用于离散随机变量,概率密度函数(Probability Density

浏览 0 更新 2025-10-26

概率函数 (Probability Function)

概率函数是概率论中的核心概念,用于以数学形式精确描述一个随机变量取各个可能值的概率分布规律。根据随机变量的类型——离散或连续——概率函数表现为不同的数学形式:概率质量函数(Probability Mass Function, PMF)用于离散随机变量,概率密度函数(Probability Density Function, PDF)用于连续随机变量,而累积分布函数(Cumulative Distribution Function, CDF)则在两类情形下均统一适用。概率函数构成了统计推断计量经济学以及更广泛的概率建模的数学基础。

离散型:概率质量函数 (PMF)

XX 为定义在样本空间 Ω\Omega 上的离散随机变量,其可能取值为可数集 {x1,x2,}\{x_1, x_2, \ldots\}。概率质量函数是一个映射 p:R[0,1]p: \mathbb{R} \to [0, 1],定义为:

pX(x)=P(X=x),xRp_X(x) = P(X = x), \quad \forall x \in \mathbb{R}

PMF必须满足两条基本公理:第一,非负性——对所有 xxpX(x)0p_X(x) \geq 0;第二,归一性——xXpX(x)=1\sum_{x \in \mathcal{X}} p_X(x) = 1,其中 X\mathcal{X}XX 的所有可能取值集合。对于不在取值范围内的 xxpX(x)=0p_X(x) = 0

经典离散分布均由各自的PMF刻画。伯努利分布的PMF为 pX(x)=px(1p)1xp_X(x) = p^x (1-p)^{1-x},仅定义于 x{0,1}x \in \{0, 1\}二项分布 XBinomial(n,p)X \sim \text{Binomial}(n, p) 的PMF为 pX(k)=(nk)pk(1p)nkp_X(k) = \binom{n}{k} p^k (1-p)^{n-k},其中 k=0,1,,nk = 0, 1, \ldots, n,描述了 nn 次独立伯努利试验中成功次数的分布。泊松分布 XPoisson(λ)X \sim \text{Poisson}(\lambda) 的PMF为 pX(k)=λkeλk!p_X(k) = \frac{\lambda^k e^{-\lambda}}{k!},在单位时间内稀有事件发生次数的建模中广泛应用。PMF的图形表示通常为针状图(lollipop chart),直观展示每一取值上的概率质量。

连续型:概率密度函数 (PDF)

当随机变量 XX 为连续型时,其在任意单一点上取值的概率均为零:P(X=x)=0P(X = x) = 0。因此,概率密度函数并不直接给出概率值,而是通过积分来衡量概率。PDF是一个非负可积函数 fX:R[0,)f_X: \mathbb{R} \to [0, \infty),使得对于任意区间 [a,b][a, b]

P(aXb)=abfX(x)dxP(a \leq X \leq b) = \int_a^b f_X(x)\, dx

PDF必须满足两条条件:对所有 xxfX(x)0f_X(x) \geq 0(非负性),且 fX(x)dx=1\int_{-\infty}^{\infty} f_X(x)\, dx = 1(归一性)。与PMF不同,PDF在某一点的值 fX(x)f_X(x) 可以大于1,只要其积分不超过1即可。

最常见的连续分布是正态分布 XN(μ,σ2)X \sim N(\mu, \sigma^2),其PDF为 fX(x)=12πσ2exp((xμ)22σ2)f_X(x) = \frac{1}{\sqrt{2\pi\sigma^2}} \exp\left(-\frac{(x-\mu)^2}{2\sigma^2}\right),钟形曲线关于均值 μ\mu 对称。均匀分布 XU(a,b)X \sim U(a, b) 的PDF为 fX(x)=1baf_X(x) = \frac{1}{b-a}x[a,b]x \in [a, b],否则为0。指数分布 XExp(λ)X \sim \text{Exp}(\lambda) 的PDF为 fX(x)=λeλxf_X(x) = \lambda e^{-\lambda x}x0x \geq 0),是唯一具有无记忆性的连续分布,广泛用于可靠性分析和排队论。

累积分布函数 (CDF)

累积分布函数是连接离散与连续情形、具有最一般适用性的概率函数。CDF定义为:

FX(x)=P(Xx),xRF_X(x) = P(X \leq x), \quad \forall x \in \mathbb{R}

CDF具有四个基本性质:单调非减(若 x1<x2x_1 < x_2,则 FX(x1)FX(x2)F_X(x_1) \leq F_X(x_2))、右连续limxFX(x)=0\lim_{x \to -\infty} F_X(x) = 0limx+FX(x)=1\lim_{x \to +\infty} F_X(x) = 1。对于离散随机变量,CDF为阶梯函数,跳跃点位于各取值处,跳跃高度等于该点的概率质量:FX(x)=xixpX(xi)F_X(x) = \sum_{x_i \leq x} p_X(x_i)。对于连续随机变量,CDF为光滑的连续函数,且 FX(x)=xfX(t)dtF_X(x) = \int_{-\infty}^x f_X(t)\, dt;在PDF连续的点上,fX(x)=FX(x)f_X(x) = F_X'(x)

概率函数与测度论基础

测度论的框架下,PMF和PDF得以统一处理。随机变量 XX 诱导出 R\mathbb{R} 上的一个概率测度 PXP_X,称为分布(distribution)。对于离散型,PXP_X 关于计数测度(counting measure)的Radon-Nikodym导数即为PMF;对于连续型,PXP_X 关于Lebesgue测度的Radon-Nikodym导数即为PDF。这一观点揭示了概率函数本质上是概率分布在不同基准测度下的密度表示,为概率空间的公理化处理提供了统一的语言。

概率函数的经济学应用

计量经济学中,概率函数是最大似然估计(MLE)方法的核心。给定样本 {X1,,Xn}\{X_1, \ldots, X_n\},似然函数为 L(θ)=i=1nfX(Xi;θ)L(\theta) = \prod_{i=1}^n f_X(X_i; \theta),其中 fXf_X 是依赖于未知参数 θ\theta 的PDF(或PMF)。对数似然函数 (θ)=i=1nlogfX(Xi;θ)\ell(\theta) = \sum_{i=1}^n \log f_X(X_i; \theta) 的最大化产生MLE估计量。在风险分析保险精算中,概率函数用于刻画损失分布、计算VaR(Value at Risk)和CVaR等风险度量。在贝叶斯统计中,先验分布和后验分布的PDF/PMF通过贝叶斯定理连接,构成贝叶斯推断的完整流程。此外,Copula函数通过对边缘分布的CDF进行耦合来建模多变量依赖结构,而这一过程的起点正是各变量的概率函数。