ARTICLE

离散型随机变量

离散型随机变量 (Discrete Random Variable) 在概率论与统计学中,离散型随机变量是一个基础且核心的概念。它是一种其可能取值是"可数"的随机变量,所有可能值要么是有限的,要么是可数无限的。 一个随机变量本质上是一个函数,它将一个随机试验的每一个可能结果(即样本空间中的一个元素)映射到一个唯一的实数。根据这些实数取值的特性,随机变量被分为

浏览 23 更新 2026-05-26

离散型随机变量 (Discrete Random Variable)

概率论统计学中,离散型随机变量是一个基础且核心的概念。它是一种其可能取值是"可数"的随机变量,所有可能值要么是有限的,要么是可数无限的。

一个随机变量本质上是一个函数,它将一个随机试验的每一个可能结果(即样本空间中的一个元素)映射到一个唯一的实数。根据这些实数取值的特性,随机变量被分为离散型和连续型随机变量两大类。离散型随机变量通常与计数过程相关,例如抛硬币出现的正面次数、一个小时内到达银行的顾客人数等。

形式化定义

要准确理解离散型随机变量,需要先理解两个组成部分:

随机变量 (Random Variable):在数学上,一个随机变量 XX 是一个定义在样本空间 Ω\Omega 上的函数,它将每个样本点 ωΩ\omega \in \Omega 映射到实数集 R\mathbb{R} 上的一个值,即 X(ω)=xX(\omega) = x。简而言之,它为随机现象的结果赋予一个数值。例如,在抛掷一枚骰子的试验中,样本空间为 Ω={一点,二点,,六点}\Omega = \{ \text{一点}, \text{二点}, \ldots, \text{六点} \}。我们可以定义一个随机变量 XX 为掷出的点数,那么 XX 就将这些文字结果映射为数字 {1,2,3,4,5,6}\{1, 2, 3, 4, 5, 6\}

"离散"的特性 (The "Discrete" Property):一个随机变量被称为离散的,如果其所有可能取值的集合是可数的 (countable)。可数集包括两种情况:

  • 有限集 (Finite Set):可能的取值数量是有限的。例如,一枚骰子的点数 XX 只能取 {1,2,3,4,5,6}\{1, 2, 3, 4, 5, 6\} 这6个值。
  • 可数无限集 (Countably Infinite Set):可能的取值是无限的,但可以与自然数集 {1,2,3,}\{1, 2, 3, \dots\} 建立一一对应的关系。例如,假设我们不停地抛掷一枚硬币直至第一次出现正面为止,令随机变量 YY 为所需的抛掷次数,YY 的可能取值为 {1,2,3,4,}\{1, 2, 3, 4, \dots\}。这个集合是无限的,但它是可数的。

与离散型随机变量相对的是连续型随机变量,后者的可能取值可以充满一个或多个区间,是不可数的,例如一个地区明天的降雨量。

概率质量函数与累积分布函数

为了完整地描述一个离散型随机变量的统计特性,我们主要使用以下两个函数:

概率质量函数 (Probability Mass Function, PMF)概率质量函数是描述离散型随机变量最直接的方式。对于一个离散型随机变量 XX,其PMF定义为 pX(x)=P(X=x)p_X(x) = P(X=x),表示变量 XX 精确等于某个特定值 xx 的概率。PMF必须满足两个基本性质:

  1. 非负性:对于任意值 xx,都有 pX(x)0p_X(x) \ge 0
  2. 归一性:所有可能取值的概率之和必须等于1,即: \[ \sum_{x} p_X(x) = 1 \] 其中求和的范围是 XX 所有可能的取值。

以公平六面骰子为例,随机变量 XX 代表掷出的点数,其PMF为: pXp_X(k) = P(X=k) = 16\frac{1}{6}, \quad 对于 \text{对于 } k \in \{1, 2, 3, 4, 5, 6\} 对于任何其他值 kk(如 k=2.5k=2.5k=7k=7),pX(k)=0p_X(k) = 0

累积分布函数 (Cumulative Distribution Function, CDF)累积分布函数是一个更具普适性的工具,对离散和连续随机变量都适用。对于随机变量 XX,其CDF定义为 FX(x)=P(Xx)F_X(x) = P(X \le x),表示变量 XX 的取值小于或等于某个特定值 xx 的概率。对于离散型随机变量,其CDF可以通过对PMF求和得到:

FX(x)=kxpX(k)F_X(x) = \sum_{k \le x} p_X(k)

离散型随机变量的CDF是一个阶梯函数 (step function),它在每个可能的取值点上发生跳跃,跳跃的高度等于该点的概率质量。以骰子为例,其CDF FX(x)F_X(x)x=1,2,3,4,5,6x=1, 2, 3, 4, 5, 6 各点处向上跳跃,每步高度为 1/61/6

数字特征

期望 (Expected Value)期望(或称均值)是随机变量的中心趋势度量,代表了在大量重复试验中该随机变量的平均取值。对于离散型随机变量 XX,其期望记为 E[X]E[X]μX\mu_X,计算公式为:

E[X]=xxpX(x)E[X] = \sum_{x} x \cdot p_X(x)

它是一个加权平均,每个可能取值 xx 的权重是其发生的概率 pX(x)p_X(x)。对于骰子,E[X]=1(16)+2(16)++6(16)=216=3.5E[X] = 1(\frac{1}{6}) + 2(\frac{1}{6}) + \dots + 6(\frac{1}{6}) = \frac{21}{6} = 3.5。尽管3.5不是一个可能的掷骰结果,但它代表了长期平均值。

方差与标准差 (Variance and Standard Deviation)方差标准差是衡量随机变量取值分散程度的度量。方差越大,表示数据点越分散于均值两侧。方差记为 Var(X)\operatorname{Var}(X)σX2\sigma_X^2,定义为:

Var(X)=E[(XμX)2]=x(xμX)2pX(x)\operatorname{Var}(X) = E[(X - \mu_X)^2] = \sum_{x} (x - \mu_X)^2 \cdot p_X(x)

一个更方便计算的公式为 Var(X)=E[X2](E[X])2\operatorname{Var}(X) = E[X^2] - (E[X])^2,其中 E[X2]=xx2pX(x)E[X^2] = \sum_x x^2 \cdot p_X(x)。标准差记为 σX\sigma_X,是方差的算术平方根:σX=Var(X)\sigma_X = \sqrt{\operatorname{Var}(X)}。标准差的单位与随机变量本身的单位相同,因此在解释上更为直观。

常见离散概率分布

在实践中,许多现象都可以用标准化的离散概率分布来建模:

  • 伯努利分布 (Bernoulli Distribution):描述单次试验的结果,该试验只有两个可能的结果(成功/失败)。是构建其他更复杂离散分布的基础。
  • 二项分布 (Binomial Distribution):描述在 nn 次独立的伯努利试验中成功事件发生的确切次数。例如,抛10次硬币出现6次正面的概率。
  • 泊松分布 (Poisson Distribution):描述在一个固定的时间或空间单位内某事件发生的次数,前提是该事件以一个已知的平均速率独立发生。
  • 几何分布 (Geometric Distribution):描述在连续的伯努利试验中为获得第一次成功所需要进行的试验次数。
  • 超几何分布 (Hypergeometric Distribution):描述从一个包含成功和失败两类元素的有限总体中进行不放回抽样时,样本中成功元素的数量。

离散型随机变量与连续型随机变量共同构成概率论中随机变量的完整分类体系,是概率分布理论的基础概念。