ARTICLE

离散随机变量

离散随机变量 (Discrete Random Variable) 在概率论和统计学中，随机变量 (Random Variable) 是核心概念之一。它是一个将样本空间（即随机试验所有可能结果的集合）中的每个结果映射到实数值的函数。简而言之，它的取值由随机事件的结果决定。随机变量分为两大类：离散随机变量和连续随机变量。离散随机变量 (Discr

浏览 56 更新 2025-10-26

离散随机变量 (Discrete Random Variable)

在概率论和统计学中，随机变量 (Random Variable) 是核心概念之一。它是一个将样本空间（即随机试验所有可能结果的集合）中的每个结果映射到实数值的函数。简而言之，它的取值由随机事件的结果决定。随机变量分为两大类：离散随机变量和连续随机变量。

离散随机变量 (Discrete Random Variable) 是指其可能取值为有限个或可数无穷个的随机变量。"可数"意味着所有可能的取值可以被一一列举，如同整数 $1, 2, 3, \ldots$ 一般。

典型例子：

掷一枚六面骰子的点数：取值集合为 $\{1, 2, 3, 4, 5, 6\}$ ，是 有限的。
抛掷硬币 10 次，正面朝上的次数：取值集合为 $\{0, 1, 2, \dots, 10\}$ ，是 有限的。
某一小时内到达银行的客户数量：取值集合为 $\{0, 1, 2, 3, \dots\}$ ，是 可数无穷的——因为理论上客户数没有上限，但可以逐一计数。

与之相对的，连续随机变量 (Continuous Random Variable) 可取某一区间内的任意实数值，其可能取值是不可数的。例如，一个人的身高、室外温度或股票收益率——这些量可以在一个连续区间内取无穷多个值。

概率质量函数 (PMF)

概率质量函数 (Probability Mass Function, PMF) 是描述离散随机变量概率分布的核心工具。它将随机变量的每一个可能取值映射到该值出现的概率。记随机变量为 $X$ ，其 PMF 通常记为 $p(x)$ 或 $P(X=x)$ 。

合法的 PMF 必须满足两个条件：

对每个可能的取值 $x$ ，概率值必须在 0 和 1 之间： $0 \le P(X=x) \le 1$ 。
所有可能取值 $x_i$ 的概率之和等于 1： \[ \sum_{i=1}^{n} P(X=x_i) = 1 \] 若可能取值为可数无穷，则上式变为无穷级数求和。

示例（公平六面骰子）：令 $X$ 表示骰子的点数，其可能取值为 $\{1, 2, 3, 4, 5, 6\}$ 。由于骰子是公平的，每个点数出现的概率相等，因此 PMF 为 $P(X=i)=1/6$ （ $i=1,2,\dots,6$ ）。容易验证： $\sum_{i=1}^{6} 1/6 = 1$ 。

累积分布函数 (CDF)

累积分布函数 (Cumulative Distribution Function, CDF) 描述随机变量 $X$ 的取值不超过某一特定值 $x$ 的概率，对离散和连续随机变量均有定义：

F(x) = P(X \le x)

对于离散随机变量，CDF 是对 PMF 的累加求和：

F(x) = \sum_{k \le x} P(X=k)

离散随机变量的 CDF 具有如下特征：

它是 非递减函数，且为 阶梯函数 (Step Function)。
在每个可能取值点发生跳跃，跳跃高度等于该点的概率质量： $P(X=x) = F(x) - \lim_{y \to x^-} F(y)$ 。
当 $x \to -\infty$ 时， $F(x) \to 0$ ；当 $x \to +\infty$ 时， $F(x) \to 1$ 。

示例（公平骰子）：

若 $x < 1$ ， $F(x)=0$
若 $1 \le x < 2$ ， $F(x)=P(X=1)=1/6$
若 $2 \le x < 3$ ， $F(x)=P(X=1)+P(X=2)=2/6$
$\cdots$
若 $x \ge 6$ ， $F(x)=\sum_{i=1}^{6}P(X=i)=1$

该函数在 $x=1,2,3,4,5,6$ 六个点上发生跳跃，每次跳跃高度均为 $1/6$ 。

期望 (Expected Value)

期望 (Expected Value)，也称均值 (Mean)，是离散随机变量所有可能取值按其概率加权的平均，反映该变量在大量重复试验中的长期平均表现：

E[X] = \mu = \sum_{i} x_i \cdot P(X=x_i)

示例（公平骰子）：

E[X] = 1\cdot\frac{1}{6} + 2\cdot\frac{1}{6} + \cdots + 6\cdot\frac{1}{6} = \frac{21}{6} = 3.5

注意，期望值 3.5 本身并非一个可能的试验结果，但它准确刻画了该分布的中心位置——设想反复掷骰子并记录平均值，结果将趋近 3.5。

期望具有线性性质：对任意常数 $a, b$ 和随机变量 $X, Y$ ，有 $E[aX+bY] = aE[X] + bE[Y]$ 。这一性质在统计推断与计量经济学中极为重要。

方差与标准差 (Variance and Standard Deviation)

方差 (Variance) 衡量随机变量取值相对于其期望的离散程度，方差越大表示数据越分散：

Var(X) = \sigma^2 = E[(X-\mu)^2] = \sum_{i} (x_i - \mu)^2 \cdot P(X=x_i)

计算中常用以下简化公式：

Var(X) = E[X^2] - (E[X])^2,\quad \text{其中 } E[X^2] = \sum_{i} x_i^2 \cdot P(X=x_i)

标准差 (Standard Deviation) 是方差的算术平方根 $\sigma = \sqrt{Var(X)}$ 。标准差与随机变量本身量纲相同，因此在实际解释中比方差更直观。

示例（公平骰子）：

E[X^2] = \frac{1^2+2^2+3^2+4^2+5^2+6^2}{6} = \frac{91}{6} \approx 15.167

Var(X) = \frac{91}{6} - (3.5)^2 \approx 15.167 - 12.25 = 2.917,\quad \sigma \approx 1.708

常见离散概率分布

许多现实随机现象遵循经典的离散分布模型，以下为最常用的几种：

伯努利分布 (Bernoulli Distribution)：描述单次只有两种结果（成功/失败）的试验。例如抛一次硬币的结果。
二项分布 (Binomial Distribution)： $n$ 次独立伯努利试验中成功的总次数。例如抛 10 次硬币正面朝上的次数，记为 $X \sim B(n, p)$ 。
泊松分布 (Poisson Distribution)：固定时间或空间单位内某随机事件发生的次数。例如网站服务器每分钟收到的请求数，常记为 $X \sim \text{Poisson}(\lambda)$ 。
几何分布 (Geometric Distribution)：一系列独立伯努利试验中，为获得首次成功所需的试验次数。例如反复掷骰子直到第一次出现 6 点所需的次数。
超几何分布 (Hypergeometric Distribution)：从有限总体中进行不放回抽样时，样本中具有特定特征的个体数。例如从一副扑克牌中抽取 5 张，其中 A 牌的数量。

与连续随机变量的对比

离散与连续随机变量的核心区别不在于取值的有限性，而在于概率的描述方式。离散情形用 PMF 直接给出单点概率，而连续情形下，单点的概率恒为零——必须通过 概率密度函数 (Probability Density Function, PDF) 和积分来描述区间概率。此外，离散变量的 CDF 呈阶梯状，连续变量的 CDF 则是光滑连续曲线。

高阶矩与分布特征

除期望（一阶矩）和方差（二阶中心矩）外，离散随机变量的分布特征还可通过更高阶矩来刻画。偏度 (Skewness) 基于三阶中心矩度量分布的非对称性：正偏意味着右尾更长，大部分概率质量集中在左侧；负偏则相反。峰度 (Kurtosis) 基于四阶中心矩描述分布的尾部厚度——高峰度意味着极端值出现的概率较正态分布更大。对于离散分布而言，泊松分布是右偏的（偏度 $=1/\sqrt{\lambda}$ ），而对称的二项分布在 $p=0.5$ 时偏度为零。这些数字特征在选择模型和诊断数据分布时具有重要参考价值。

离散随机变量是概率论的基石概念，理解其定义与性质是掌握概率分布、统计推断和计量经济学方法论的基础，也是学习随机过程以及金融工程中期权定价二叉树模型等进阶内容的前提。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。