ARTICLE

概率密度函数 (PDF)

概率密度函数 (Probability Density Function, PDF) 概率密度函数（Probability Density Function, PDF）是描述连续型随机变量概率分布的核心工具。与离散型随机变量使用概率质量函数（PMF）直接给出每个点的概率不同，连续随机变量取任意单个特定值的概率恒为零，因此必须通过密度函数在区间上的积分来刻画概

浏览 0 更新 2025-10-26

概率密度函数 (Probability Density Function, PDF)

概率密度函数（Probability Density Function, PDF）是描述连续型随机变量概率分布的核心工具。与离散型随机变量使用概率质量函数（PMF）直接给出每个点的概率不同，连续随机变量取任意单个特定值的概率恒为零，因此必须通过密度函数在区间上的积分来刻画概率。直观上，密度函数 $f(x)$ 在某一点 $x$ 处的值并不代表该点的概率，而是表示随机变量取值落在 $x$ 附近一个极小邻域内的"概率密度"——数值越高，观测值落入该区域的相对可能性越大。

正式定义

设 $X$ 为连续型随机变量，其累积分布函数（CDF）为 $F_X(x) = P(X \le x)$ 。若存在非负可积函数 $f_X: \mathbb{R} \to [0, \infty)$ ，使得对任意实数 $x$ 有：

F_X(x) = \int_{-\infty}^{x} f_X(t) \, dt

则称 $f_X$ 为 $X$ 的概率密度函数。由微积分基本定理，在 $f_X$ 的连续点处有 $f_X(x) = F_X'(x)$ 。任一区间 $[a, b]$ 上的概率由积分给出：

P(a \le X \le b) = \int_{a}^{b} f_X(x) \, dx

基本性质

概率密度函数必须满足以下两条公理化约束：

非负性： $f_X(x) \ge 0$ 对所有 $x \in \mathbb{R}$ 成立。这是概率非负的直接推论。
归一化： $\int_{-\infty}^{\infty} f_X(x) \, dx = 1$ 。这等价于 $F_X(\infty) = 1$ ，即随机变量必然落在实数轴上某处。

重要注意事项：与概率质量函数不同，密度函数的值可以大于 1。例如，区间 $[0, 0.5]$ 上的均匀分布 $X \sim U(0, 0.5)$ 的密度函数为 $f(x) = 2$ （当 $x \in [0, 0.5]$ ）。 $f(x) > 1$ 并不违反概率公理，因为概率由积分面积而非单点值决定。只要总面积（积分）为 1、每一步的高度（密度）为非负，函数就是有效的密度函数。

与累积分布函数的关系

PDF 与 CDF 构成微积分中的导数-积分对：

f_X(x) = \frac{d}{dx} F_X(x), \quad F_X(x) = \int_{-\infty}^{x} f_X(t) \, dt

这一关系具有重要的计算意义：当 CDF 具有显式表达式时，可通过求导获得 PDF；反之，当 PDF 形式简洁但 CDF 无封闭形式时（如正态分布），概率需通过数值积分或查表获得。对于分段定义的密度函数，CDF 通常在分段点处连续但不可导。

常见连续分布及其密度函数

以下是统计学和计量经济学中最常遇到的密度函数：

正态分布 $X \sim N(\mu, \sigma^2)$ ：

f(x) = \frac{1}{\sqrt{2\pi\sigma^2}} \exp\left(-\frac{(x - \mu)^2}{2\sigma^2}\right), \quad x \in \mathbb{R}

正态密度呈钟形，以 $\mu$ 为中心、 $\sigma$ 控制离散程度。由中心极限定理保证其在统计推断中的核心地位。

均匀分布 $X \sim U(a, b)$ ：

f(x) = \frac{1}{b - a}, \quad x \in [a, b]

最简单的连续分布，在区间内等可能。

指数分布 $X \sim \text{Exp}(\lambda)$ ：

f(x) = \lambda e^{-\lambda x}, \quad x \ge 0

具有无记忆性，广泛用于建模等待时间和故障时间。参数 $\lambda > 0$ 为速率参数。

伽玛分布 $X \sim \text{Gamma}(\alpha, \beta)$ ：

f(x) = \frac{\beta^\alpha}{\Gamma(\alpha)} x^{\alpha - 1} e^{-\beta x}, \quad x \ge 0

其中 $\Gamma(\alpha)$ 为伽玛函数。指数分布和卡方分布均为伽玛分布的特例。

Beta分布 $X \sim \text{Beta}(\alpha, \beta)$ ：

f(x) = \frac{\Gamma(\alpha + \beta)}{\Gamma(\alpha)\Gamma(\beta)} x^{\alpha - 1} (1 - x)^{\beta - 1}, \quad x \in [0, 1]

定义在有限区间 $[0, 1]$ 上，是贝叶斯统计中二项似然的共轭先验。

随机变量变换的密度函数

若 $X$ 具有密度 $f_X$ ，而 $Y = g(X)$ 是 $X$ 的严格单调可微函数，则 $Y$ 的密度由变量变换公式给出：

f_Y(y) = f_X\big(g^{-1}(y)\big) \cdot \left| \frac{d}{dy} g^{-1}(y) \right|

对于非单调变换，需将定义域分割为单调区间分别处理并求和。多维情形下推广为：

f_{\mathbf{Y}}(\mathbf{y}) = f_{\mathbf{X}}\big(g^{-1}(\mathbf{y})\big) \cdot \left| \det J_{g^{-1}}(\mathbf{y}) \right|

其中 $J_{g^{-1}}$ 为逆变换的雅可比矩阵， $\det$ 为其行列式的绝对值。这一技术在推导t分布、F分布等抽样分布时不可回避。

联合密度、边缘密度与条件密度

多维连续随机向量 $\mathbf{X} = (X_1, \ldots, X_n)$ 的概率行为由联合概率密度函数 $f_{X_1, \ldots, X_n}(x_1, \ldots, x_n)$ 描述。单个分量 $X_i$ 的边缘密度通过对其他所有变量积分获得：

f_{X_i}(x_i) = \int_{-\infty}^{\infty} \cdots \int_{-\infty}^{\infty} f_{\mathbf{X}}(x_1, \ldots, x_n) \, dx_1 \cdots dx_{i-1} \, dx_{i+1} \cdots dx_n

给定 $X_2 = x_2$ 时 $X_1$ 的条件密度定义为：

f_{X_1 \mid X_2}(x_1 \mid x_2) = \frac{f_{X_1, X_2}(x_1, x_2)}{f_{X_2}(x_2)}, \quad f_{X_2}(x_2) > 0

条件密度是条件期望、回归分析和贝叶斯推断的基础构件。从联合密度到条件密度的分解体现了统计建模中"从联合分布理解变量间全部依赖关系"的核心思想。

在经济学与计量经济学中的应用

概率密度函数贯穿经济学实证研究的每一个环节。在最大似然估计（MLE）中，似然函数由观测数据的联合密度构造——独立样本下的联合密度为各观测密度的乘积，最大化该乘积即得参数估计。在假设检验中，检验统计量在零假设下的密度决定了临界值和p值的计算。

在金融计量经济学中，资产收益率的密度估计是风险价值（VaR）和期望尾部损失（ES）等风险度量计算的前提。金融收益数据通常呈现尖峰厚尾特征（相对于正态分布），促使研究者使用t分布、广义误差分布（GED）或偏态分布族来更准确地拟合尾部的概率密度。

在微观计量经济学中，样本选择模型（如Heckman两阶段法）和处理效应模型的识别与估计依赖于对潜变量联合密度的参数假设。核密度估计等非参数方法则在无需预设分布形式的情况下，直接从数据中估计密度函数，为探索性数据分析和稳健推断提供了灵活的工具。

概率密度函数不仅是一个数学定义，更是连接概率理论、统计推断和经济实证研究的桥梁。掌握密度函数的性质、变换和多元扩展，是理解现代计量经济学方法的必要条件。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。