ARTICLE

离散随机变量

离散随机变量 (Discrete Random Variable) 在 概率论 和 统计学 中,随机变量 (Random Variable) 是核心概念之一。它是一个将 样本空间(即随机试验所有可能结果的集合)中的每个结果映射到实数值的函数。简而言之,它的取值由随机事件的结果决定。随机变量分为两大类:离散随机变量和 连续随机变量。 离散随机变量 (Discr

浏览 56 更新 2025-10-26

离散随机变量 (Discrete Random Variable)

概率论统计学 中,随机变量 (Random Variable) 是核心概念之一。它是一个将 样本空间(即随机试验所有可能结果的集合)中的每个结果映射到实数值的函数。简而言之,它的取值由随机事件的结果决定。随机变量分为两大类:离散随机变量连续随机变量

离散随机变量 (Discrete Random Variable) 是指其可能取值为有限个或可数无穷个的随机变量。"可数"意味着所有可能的取值可以被一一列举,如同整数 1,2,3,1, 2, 3, \ldots 一般。

典型例子:

  • 掷一枚六面骰子的点数:取值集合为 {1,2,3,4,5,6}\{1, 2, 3, 4, 5, 6\},是 有限的
  • 抛掷硬币 10 次,正面朝上的次数:取值集合为 {0,1,2,,10}\{0, 1, 2, \dots, 10\},是 有限的
  • 某一小时内到达银行的客户数量:取值集合为 {0,1,2,3,}\{0, 1, 2, 3, \dots\},是 可数无穷的——因为理论上客户数没有上限,但可以逐一计数。

与之相对的,连续随机变量 (Continuous Random Variable) 可取某一区间内的任意实数值,其可能取值是不可数的。例如,一个人的身高、室外温度或股票收益率——这些量可以在一个连续区间内取无穷多个值。

概率质量函数 (PMF)

概率质量函数 (Probability Mass Function, PMF) 是描述离散随机变量概率分布的核心工具。它将随机变量的每一个可能取值映射到该值出现的概率。记随机变量为 XX,其 PMF 通常记为 p(x)p(x)P(X=x)P(X=x)

合法的 PMF 必须满足两个条件:

  1. 对每个可能的取值 xx,概率值必须在 0 和 1 之间:0P(X=x)10 \le P(X=x) \le 1
  2. 所有可能取值 xix_i 的概率之和等于 1: \[ \sum_{i=1}^{n} P(X=x_i) = 1 \] 若可能取值为可数无穷,则上式变为无穷级数求和。

示例(公平六面骰子):XX 表示骰子的点数,其可能取值为 {1,2,3,4,5,6}\{1, 2, 3, 4, 5, 6\}。由于骰子是公平的,每个点数出现的概率相等,因此 PMF 为 P(X=i)=1/6P(X=i)=1/6i=1,2,,6i=1,2,\dots,6)。容易验证:i=161/6=1\sum_{i=1}^{6} 1/6 = 1

累积分布函数 (CDF)

累积分布函数 (Cumulative Distribution Function, CDF) 描述随机变量 XX 的取值不超过某一特定值 xx 的概率,对离散和连续随机变量均有定义:

F(x)=P(Xx)F(x) = P(X \le x)

对于离散随机变量,CDF 是对 PMF 的累加求和:

F(x)=kxP(X=k)F(x) = \sum_{k \le x} P(X=k)

离散随机变量的 CDF 具有如下特征:

  • 它是 非递减函数,且为 阶梯函数 (Step Function)。
  • 在每个可能取值点发生跳跃,跳跃高度等于该点的概率质量:P(X=x)=F(x)limyxF(y)P(X=x) = F(x) - \lim_{y \to x^-} F(y)
  • xx \to -\infty 时,F(x)0F(x) \to 0;当 x+x \to +\infty 时,F(x)1F(x) \to 1

示例(公平骰子):

  • x<1x < 1F(x)=0F(x)=0
  • 1x<21 \le x < 2F(x)=P(X=1)=1/6F(x)=P(X=1)=1/6
  • 2x<32 \le x < 3F(x)=P(X=1)+P(X=2)=2/6F(x)=P(X=1)+P(X=2)=2/6
  • \cdots
  • x6x \ge 6F(x)=i=16P(X=i)=1F(x)=\sum_{i=1}^{6}P(X=i)=1

该函数在 x=1,2,3,4,5,6x=1,2,3,4,5,6 六个点上发生跳跃,每次跳跃高度均为 1/61/6

期望 (Expected Value)

期望 (Expected Value),也称 均值 (Mean),是离散随机变量所有可能取值按其概率加权的平均,反映该变量在大量重复试验中的长期平均表现:

E[X]=μ=ixiP(X=xi)E[X] = \mu = \sum_{i} x_i \cdot P(X=x_i)

示例(公平骰子):

E[X]=116+216++616=216=3.5E[X] = 1\cdot\frac{1}{6} + 2\cdot\frac{1}{6} + \cdots + 6\cdot\frac{1}{6} = \frac{21}{6} = 3.5

注意,期望值 3.5 本身并非一个可能的试验结果,但它准确刻画了该分布的中心位置——设想反复掷骰子并记录平均值,结果将趋近 3.5。

期望具有线性性质:对任意常数 a,ba, b 和随机变量 X,YX, Y,有 E[aX+bY]=aE[X]+bE[Y]E[aX+bY] = aE[X] + bE[Y]。这一性质在统计推断与计量经济学中极为重要。

方差与标准差 (Variance and Standard Deviation)

方差 (Variance) 衡量随机变量取值相对于其期望的离散程度,方差越大表示数据越分散:

Var(X)=σ2=E[(Xμ)2]=i(xiμ)2P(X=xi)Var(X) = \sigma^2 = E[(X-\mu)^2] = \sum_{i} (x_i - \mu)^2 \cdot P(X=x_i)

计算中常用以下简化公式:

Var(X)=E[X2](E[X])2,其中 E[X2]=ixi2P(X=xi)Var(X) = E[X^2] - (E[X])^2,\quad \text{其中 } E[X^2] = \sum_{i} x_i^2 \cdot P(X=x_i)

标准差 (Standard Deviation) 是方差的算术平方根 σ=Var(X)\sigma = \sqrt{Var(X)}。标准差与随机变量本身量纲相同,因此在实际解释中比方差更直观。

示例(公平骰子):

E[X2]=12+22+32+42+52+626=91615.167E[X^2] = \frac{1^2+2^2+3^2+4^2+5^2+6^2}{6} = \frac{91}{6} \approx 15.167
Var(X)=916(3.5)215.16712.25=2.917,σ1.708Var(X) = \frac{91}{6} - (3.5)^2 \approx 15.167 - 12.25 = 2.917,\quad \sigma \approx 1.708

常见离散概率分布

许多现实随机现象遵循经典的离散分布模型,以下为最常用的几种:

  • 伯努利分布 (Bernoulli Distribution):描述单次只有两种结果(成功/失败)的试验。例如抛一次硬币的结果。
  • 二项分布 (Binomial Distribution)nn 次独立 伯努利试验 中成功的总次数。例如抛 10 次硬币正面朝上的次数,记为 XB(n,p)X \sim B(n, p)
  • 泊松分布 (Poisson Distribution):固定时间或空间单位内某随机事件发生的次数。例如网站服务器每分钟收到的请求数,常记为 XPoisson(λ)X \sim \text{Poisson}(\lambda)
  • 几何分布 (Geometric Distribution):一系列独立伯努利试验中,为获得首次成功所需的试验次数。例如反复掷骰子直到第一次出现 6 点所需的次数。
  • 超几何分布 (Hypergeometric Distribution):从有限总体中进行不放回抽样时,样本中具有特定特征的个体数。例如从一副扑克牌中抽取 5 张,其中 A 牌的数量。

与连续随机变量的对比

离散与连续随机变量的核心区别不在于取值的有限性,而在于概率的描述方式。离散情形用 PMF 直接给出单点概率,而连续情形下,单点的概率恒为零——必须通过 概率密度函数 (Probability Density Function, PDF) 和积分来描述区间概率。此外,离散变量的 CDF 呈阶梯状,连续变量的 CDF 则是光滑连续曲线。

高阶矩与分布特征

除期望(一阶矩)和方差(二阶中心矩)外,离散随机变量的分布特征还可通过更高阶矩来刻画。偏度 (Skewness) 基于三阶中心矩度量分布的非对称性:正偏意味着右尾更长,大部分概率质量集中在左侧;负偏则相反。峰度 (Kurtosis) 基于四阶中心矩描述分布的尾部厚度——高峰度意味着极端值出现的概率较正态分布更大。对于离散分布而言,泊松分布是右偏的(偏度 =1/λ=1/\sqrt{\lambda}),而对称的二项分布在 p=0.5p=0.5 时偏度为零。这些数字特征在选择模型和诊断数据分布时具有重要参考价值。

离散随机变量是概率论的基石概念,理解其定义与性质是掌握 概率分布统计推断 和计量经济学方法论的基础,也是学习 随机过程 以及金融工程中 期权定价 二叉树模型等进阶内容的前提。