概率函数 (Probability Function)
概率函数是概率论 中的核心概念,用于以数学形式精确描述一个随机变量 取各个可能值的概率分布规律。根据随机变量的类型——离散或连续——概率函数表现为不同的数学形式:概率质量函数 (Probability Mass Function, PMF)用于离散随机变量,概率密度函数 (Probability Density Function, PDF)用于连续随机变量,而累积分布函数 (Cumulative Distribution Function, CDF)则在两类情形下均统一适用。概率函数构成了统计推断 、计量经济学 以及更广泛的概率建模的数学基础。
离散型:概率质量函数 (PMF)
设 X X X 为定义在样本空间 Ω \Omega Ω 上的离散随机变量,其可能取值为可数集 { x 1 , x 2 , … } \{x_1, x_2, \ldots\} { x 1 , x 2 , … } 。概率质量函数是一个映射 p : R → [ 0 , 1 ] p: \mathbb{R} \to [0, 1] p : R → [ 0 , 1 ] ,定义为:
p X ( x ) = P ( X = x ) , ∀ x ∈ R p_X(x) = P(X = x), \quad \forall x \in \mathbb{R} p X ( x ) = P ( X = x ) , ∀ x ∈ R
PMF必须满足两条基本公理:第一,非负性 ——对所有 x x x ,p X ( x ) ≥ 0 p_X(x) \geq 0 p X ( x ) ≥ 0 ;第二,归一性 ——∑ x ∈ X p X ( x ) = 1 \sum_{x \in \mathcal{X}} p_X(x) = 1 ∑ x ∈ X p X ( x ) = 1 ,其中 X \mathcal{X} X 为 X X X 的所有可能取值集合。对于不在取值范围内的 x x x ,p X ( x ) = 0 p_X(x) = 0 p X ( x ) = 0 。
经典离散分布均由各自的PMF刻画。伯努利分布 的PMF为 p X ( x ) = p x ( 1 − p ) 1 − x p_X(x) = p^x (1-p)^{1-x} p X ( x ) = p x ( 1 − p ) 1 − x ,仅定义于 x ∈ { 0 , 1 } x \in \{0, 1\} x ∈ { 0 , 1 } 。二项分布 X ∼ Binomial ( n , p ) X \sim \text{Binomial}(n, p) X ∼ Binomial ( n , p ) 的PMF为 p X ( k ) = ( n k ) p k ( 1 − p ) n − k p_X(k) = \binom{n}{k} p^k (1-p)^{n-k} p X ( k ) = ( k n ) p k ( 1 − p ) n − k ,其中 k = 0 , 1 , … , n k = 0, 1, \ldots, n k = 0 , 1 , … , n ,描述了 n n n 次独立伯努利试验中成功次数的分布。泊松分布 X ∼ Poisson ( λ ) X \sim \text{Poisson}(\lambda) X ∼ Poisson ( λ ) 的PMF为 p X ( k ) = λ k e − λ k ! p_X(k) = \frac{\lambda^k e^{-\lambda}}{k!} p X ( k ) = k ! λ k e − λ ,在单位时间内稀有事件发生次数的建模中广泛应用。PMF的图形表示通常为针状图(lollipop chart),直观展示每一取值上的概率质量。
连续型:概率密度函数 (PDF)
当随机变量 X X X 为连续型时,其在任意单一点上取值的概率均为零:P ( X = x ) = 0 P(X = x) = 0 P ( X = x ) = 0 。因此,概率密度函数并不直接给出概率值,而是通过积分来衡量概率。PDF是一个非负可积函数 f X : R → [ 0 , ∞ ) f_X: \mathbb{R} \to [0, \infty) f X : R → [ 0 , ∞ ) ,使得对于任意区间 [ a , b ] [a, b] [ a , b ] :
P ( a ≤ X ≤ b ) = ∫ a b f X ( x ) d x P(a \leq X \leq b) = \int_a^b f_X(x)\, dx P ( a ≤ X ≤ b ) = ∫ a b f X ( x ) d x
PDF必须满足两条条件:对所有 x x x ,f X ( x ) ≥ 0 f_X(x) \geq 0 f X ( x ) ≥ 0 (非负性),且 ∫ − ∞ ∞ f X ( x ) d x = 1 \int_{-\infty}^{\infty} f_X(x)\, dx = 1 ∫ − ∞ ∞ f X ( x ) d x = 1 (归一性)。与PMF不同,PDF在某一点的值 f X ( x ) f_X(x) f X ( x ) 可以大于1,只要其积分不超过1即可。
最常见的连续分布是正态分布 X ∼ N ( μ , σ 2 ) X \sim N(\mu, \sigma^2) X ∼ N ( μ , σ 2 ) ,其PDF为 f X ( x ) = 1 2 π σ 2 exp ( − ( x − μ ) 2 2 σ 2 ) f_X(x) = \frac{1}{\sqrt{2\pi\sigma^2}} \exp\left(-\frac{(x-\mu)^2}{2\sigma^2}\right) f X ( x ) = 2 π σ 2 1 exp ( − 2 σ 2 ( x − μ ) 2 ) ,钟形曲线关于均值 μ \mu μ 对称。均匀分布 X ∼ U ( a , b ) X \sim U(a, b) X ∼ U ( a , b ) 的PDF为 f X ( x ) = 1 b − a f_X(x) = \frac{1}{b-a} f X ( x ) = b − a 1 当 x ∈ [ a , b ] x \in [a, b] x ∈ [ a , b ] ,否则为0。指数分布 X ∼ Exp ( λ ) X \sim \text{Exp}(\lambda) X ∼ Exp ( λ ) 的PDF为 f X ( x ) = λ e − λ x f_X(x) = \lambda e^{-\lambda x} f X ( x ) = λ e − λ x (x ≥ 0 x \geq 0 x ≥ 0 ),是唯一具有无记忆性的连续分布,广泛用于可靠性分析和排队论。
累积分布函数 (CDF)
累积分布函数是连接离散与连续情形、具有最一般适用性的概率函数。CDF定义为:
F X ( x ) = P ( X ≤ x ) , ∀ x ∈ R F_X(x) = P(X \leq x), \quad \forall x \in \mathbb{R} F X ( x ) = P ( X ≤ x ) , ∀ x ∈ R
CDF具有四个基本性质:单调非减 (若 x 1 < x 2 x_1 < x_2 x 1 < x 2 ,则 F X ( x 1 ) ≤ F X ( x 2 ) F_X(x_1) \leq F_X(x_2) F X ( x 1 ) ≤ F X ( x 2 ) )、右连续 、lim x → − ∞ F X ( x ) = 0 \lim_{x \to -\infty} F_X(x) = 0 lim x → − ∞ F X ( x ) = 0 且 lim x → + ∞ F X ( x ) = 1 \lim_{x \to +\infty} F_X(x) = 1 lim x → + ∞ F X ( x ) = 1 。对于离散随机变量,CDF为阶梯函数,跳跃点位于各取值处,跳跃高度等于该点的概率质量:F X ( x ) = ∑ x i ≤ x p X ( x i ) F_X(x) = \sum_{x_i \leq x} p_X(x_i) F X ( x ) = ∑ x i ≤ x p X ( x i ) 。对于连续随机变量,CDF为光滑的连续函数,且 F X ( x ) = ∫ − ∞ x f X ( t ) d t F_X(x) = \int_{-\infty}^x f_X(t)\, dt F X ( x ) = ∫ − ∞ x f X ( t ) d t ;在PDF连续的点上,f X ( x ) = F X ′ ( x ) f_X(x) = F_X'(x) f X ( x ) = F X ′ ( x ) 。
概率函数与测度论基础
在测度论 的框架下,PMF和PDF得以统一处理。随机变量 X X X 诱导出 R \mathbb{R} R 上的一个概率测度 P X P_X P X ,称为分布 (distribution)。对于离散型,P X P_X P X 关于计数测度(counting measure)的Radon-Nikodym导数即为PMF;对于连续型,P X P_X P X 关于Lebesgue测度的Radon-Nikodym导数即为PDF。这一观点揭示了概率函数本质上是概率分布在不同基准测度下的密度表示,为概率空间 的公理化处理提供了统一的语言。
概率函数的经济学应用
在计量经济学 中,概率函数是最大似然估计 (MLE)方法的核心。给定样本 { X 1 , … , X n } \{X_1, \ldots, X_n\} { X 1 , … , X n } ,似然函数为 L ( θ ) = ∏ i = 1 n f X ( X i ; θ ) L(\theta) = \prod_{i=1}^n f_X(X_i; \theta) L ( θ ) = ∏ i = 1 n f X ( X i ; θ ) ,其中 f X f_X f X 是依赖于未知参数 θ \theta θ 的PDF(或PMF)。对数似然函数 ℓ ( θ ) = ∑ i = 1 n log f X ( X i ; θ ) \ell(\theta) = \sum_{i=1}^n \log f_X(X_i; \theta) ℓ ( θ ) = ∑ i = 1 n log f X ( X i ; θ ) 的最大化产生MLE估计量。在风险分析 和保险精算 中,概率函数用于刻画损失分布、计算VaR(Value at Risk)和CVaR等风险度量。在贝叶斯统计 中,先验分布和后验分布的PDF/PMF通过贝叶斯定理 连接,构成贝叶斯推断的完整流程。此外,Copula函数 通过对边缘分布的CDF进行耦合来建模多变量依赖结构,而这一过程的起点正是各变量的概率函数。
关于知经 KNOWECON
知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌,长期面向北京大学、清华大学、中国人民大学等顶尖院校,提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考,并成功进入理想院校。
知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业,获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者,长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。
我们相信,好的考研辅导不只是押题和陪跑,更是把复杂知识讲清楚、把复习路径设计清楚,并用技术让学习过程更可追踪、更可反馈、更可坚持。