知经 KNOWECON · 卓越的经济金融统计数学学习平台

离散随机变量

# 离散随机变量 (Discrete Random Variable)

在{{{概率论}}}和{{{统计学}}}中,{{{随机变量}}} (Random Variable) 是一个核心概念,它是一个将{{{样本空间}}}(即一个随机试验所有可能结果的集合)中的每个结果映射到一个实数值的函数。简而言之,它是一个其数值由随机事件的结果决定的变量。随机变量可以分为两大类:离散随机变量和{{{连续随机变量}}}。

离散随机变量 (Discrete Random Variable) 是指其可能取的值是有限个或可数无穷个的随机变量。这里的“可数”意味着我们可以将其所有可能的取值一一列举出来,就像我们数整数 1, 2, 3, $...$ 一样。

例如: * 掷一个六面骰子的点数,其可能取值为集合 $\{1, 2, 3, 4, 5, 6\}$,是有限的。 * 抛掷一枚硬币10次,正面朝上的次数,其可能取值为集合 $\{0, 1, 2, \dots, 10\}$,是有限的。 * 某一小时内到达一个银行的客户数量,其可能取值为集合 $\{0, 1, 2, 3, \dots\}$,是可数无穷的。因为理论上,客户数量没有上限,但我们可以一个一个地数出来。

与之相对的是{{{连续随机变量}}} (Continuous Random Variable),它可以取某一区间内的任何实数值,其可能取值是不可数的。例如,一个人的身高、室外的温度或者股票的收益率。

## 核心性质与函数

描述离散随机变量行为的主要工具是其概率分布,这可以通过以下两个关键函数来表达。

### 1. 概率质量函数 (Probability Mass Function, PMF)

概率质量函数 (PMF) 是描述离散随机变量概率分布的函数。它给出了该随机变量取到某一个特定值的概率。如果我们将一个离散随机变量记为 $X$,那么其PMF通常记为 $p(x)$ 或 $P(X=x)$。

一个合法的PMF必须满足以下两个条件: 1. 对于所有可能的取值 $x$,其概率必须在0和1之间:$0 \le P(X=x) \le 1$。 2. 将所有可能取值 $x_i$ 的概率相加,总和必须等于1: $$ \sum_{i=1}^{n} P(X=x_i) = 1 $$ (如果可能取值是可数无穷的,则为无穷级数求和)

示例:掷一个公平的六面骰子 令随机变量 $X$ 表示骰子的点数。其可能的取值集合为 $\{1, 2, 3, 4, 5, 6\}$。由于骰子是公平的,每个点数出现的概率相等。 其PMF为: $P(X=1) = 1/6$ $P(X=2) = 1/6$ $...$ $P(X=6) = 1/6$

我们可以验证:$\sum_{i=1}^{6} P(X=i) = 1/6 + 1/6 + 1/6 + 1/6 + 1/6 + 1/6 = 1$。

### 2. 累积分布函数 (Cumulative Distribution Function, CDF)

累积分布函数 (CDF) 描述的是随机变量 $X$ 的取值小于或等于某一个特定值 $x$ 的概率。它对离散和连续随机变量都有定义,通常记为 $F(x)$。 $$ F(x) = P(X \le x) $$ 对于离散随机变量,其CDF是通过对其PMF进行求和得到的: $$ F(x) = \sum_{k \le x} P(X=k) $$ 其中 $k$ 是所有小于或等于 $x$ 的可能取值。

离散随机变量的CDF具有以下特点: * 它是一个非递减函数。 * 它是一个阶梯函数 (Step Function),在每个可能的取值点发生跳跃。 * 跳跃的高度等于该点的概率质量,即 $P(X=x) = F(x) - \lim_{y \to x^-} F(y)$。 * 当 $x \to -\infty$ 时,$F(x) \to 0$;当 $x \to +\infty$ 时,$F(x) \to 1$。

示例:掷一个公平的六面骰子 继续使用骰子的例子,其CDF $F(x)$ 如下: * 如果 $x < 1$, $F(x) = P(X \le x) = 0$ * 如果 $1 \le x < 2$, $F(x) = P(X \le x) = P(X=1) = 1/6$ * 如果 $2 \le x < 3$, $F(x) = P(X \le x) = P(X=1) + P(X=2) = 2/6$ * $...$ * 如果 $x \ge 6$, $F(x) = P(X \le x) = \sum_{i=1}^6 P(X=i) = 1$

这个函数在 $x=1, 2, 3, 4, 5, 6$ 这几个点上发生跳跃,每次跳跃的高度均为 $1/6$。

## 重要数字特征

我们通常使用一些关键的数值来概括离散随机变量的中心趋势、离散程度等特征。

### 1. 期望 (Expected Value)

{{{期望}}} (Expected Value),也称为均值 (Mean),是离散随机变量所有可能取值按其概率加权的平均值。它表示了在大量重复试验中,我们期望该随机变量的平均取值是多少。期望通常用 $E[X]$ 或 $\mu$ 表示。 $$ E[X] = \mu = \sum_{i} x_i \cdot P(X=x_i) $$ 示例:掷一个公平的六面骰子 $E[X] = 1 \cdot \frac{1}{6} + 2 \cdot \frac{1}{6} + 3 \cdot \frac{1}{6} + 4 \cdot \frac{1}{6} + 5 \cdot \frac{1}{6} + 6 \cdot \frac{1}{6} = \frac{1+2+3+4+5+6}{6} = \frac{21}{6} = 3.5$ 注意,期望值3.5本身并不是一个可能的试验结果,但它准确地描述了该分布的中心位置。

### 2. 方差与标准差 (Variance and Standard Deviation)

{{{方差}}} (Variance) 是衡量随机变量取值与其期望值偏离程度的度量,即分布的离散程度。方差越大,表示数据点越分散。方差用 $Var(X)$ 或 $\sigma^2$ 表示。 $$ Var(X) = \sigma^2 = E[(X-\mu)^2] = \sum_{i} (x_i - \mu)^2 \cdot P(X=x_i) $$ 在实际计算中,使用下面的公式通常更方便: $$ Var(X) = E[X^2] - (E[X])^2 $$ 其中 $E[X^2] = \sum_{i} x_i^2 \cdot P(X=x_i)$。

{{{标准差}}} (Standard Deviation) 是方差的算术平方根,用 $\sigma$ 表示。它的优点是与随机变量本身具有相同的量纲,使得其意义更加直观。 $$ \sigma = \sqrt{Var(X)} $$ 示例:掷一个公平的六面骰T子 首先计算 $E[X^2]$: $E[X^2] = 1^2 \cdot \frac{1}{6} + 2^2 \cdot \frac{1}{6} + \dots + 6^2 \cdot \frac{1}{6} = \frac{1+4+9+16+25+36}{6} = \frac{91}{6}$ 然后计算方差: $Var(X) = E[X^2] - (E[X])^2 = \frac{91}{6} - (3.5)^2 = \frac{91}{6} - 12.25 \approx 15.167 - 12.25 = 2.917$ 最后计算标准差: $\sigma = \sqrt{2.917} \approx 1.708$

## 常见的离散概率分布

在实践中,许多随机现象都遵循一些经典的离散概率分布模型。 * {{{伯努利分布}}} (Bernoulli Distribution): 单次试验,结果只有两种(如成功/失败)。例如,抛一次硬币的结果。 * {{{二项分布}}} (Binomial Distribution): 在 $n$ 次独立的{{{伯努利试验}}}中,成功的次数。例如,抛10次硬币,正面朝上的次数。 * {{{泊松分布}}} (Poisson Distribution): 在一个固定的时间或空间单位内,某事件发生的次数。例如,一个网站服务器每分钟收到的请求数。 * {{{几何分布}}} (Geometric Distribution): 在一系列独立的伯努利试验中,为获得第一次成功所需要的试验次数。例如,反复掷骰子直到第一次出现6点所需的次数。 * {{{超几何分布}}} (Hypergeometric Distribution): 从一个有限总体中进行不放回抽样,样本中具有某种特征的个体数。例如,从一副扑克牌中抽取5张,其中A的数量。

掌握离散随机变量是理解更高级统计推断、{{{随机过程}}}以及金融建模(如{{{期权定价}}}中的二叉树模型)等内容的基础。