知经 KNOWECON · 卓越的经济金融统计数学学习平台

离散概率分布

# 离散概率分布 (Discrete Probability Distribution)

离散概率分布 是 {{{概率论}}} 和 {{{统计学}}} 中的一个基本概念,用于描述一个 {{{离散随机变量}}} 所有可能取值及其对应 {{{概率}}} 的完整列表或函数。

一个 {{{随机变量}}} 如果其所有可能取值的集合是 {{{可数}}} 的(即可以被一一列举,无论是有限个还是无限个),则被称为 {{{离散随机变量}}} (Discrete Random Variable)。离散概率分布就是对这种变量的概率行为的数学描述。与此相对的是 {{{连续概率分布}}},后者用于描述其取值在某个区间内不可数的 {{{连续随机变量}}}。

## 形式化定义与性质

一个离散概率分布可以通过其 {{{概率质量函数}}} (Probability Mass Function, PMF) 来唯一确定。对于一个离散随机变量 $X$,其PMF是一个函数 $p(x)$,定义为:

$$ p(x) = P(X = x) $$

该函数给出了随机变量 $X$ 精确地等于某个特定值 $x$ 的概率。

一个合法的PMF必须满足以下两个基本性质:

1. 非负性:对于随机变量 $X$ 的每一个可能取值 $x_i$,其概率必须在0和1之间(包含0和1)。 $$ 0 \le p(x_i) \le 1 $$ 2. 归一性:所有可能取值的概率之和必须等于1。如果 $S$ 是 $X$ 的所有可能取值(即{{{样本空间}}})的集合,那么: $$ \sum_{x_i \in S} p(x_i) = 1 $$ 这个性质保证了当我们考虑所有可能的结果时,其中之一必然会发生。

## 分布的数字特征

为了概括和比较不同的概率分布,我们使用一些关键的数字特征,最常用的是期望值和方差。

### 期望值 (Expected Value)

{{{期望值}}},通常用 $E[X]$ 或 $\mu$ 表示,是离散随机变量所有可能取值按其概率加权的平均值。它代表了在大量重复试验中,我们期望观察到的该随机变量的“长期平均”值。

其计算公式为: $$ E[X] = \mu = \sum_{i} x_i p(x_i) $$ 其中 $x_i$ 是随机变量的可能取值,$p(x_i)$ 是对应的概率。

### 方差与标准差 (Variance and Standard Deviation)

{{{方差}}},用 $Var(X)$ 或 $\sigma^2$ 表示,衡量的是随机变量的取值与其期望值之间的偏离程度,即分布的离散程度或“宽度”。方差越大,表示数据点越分散。

其定义式为: $$ Var(X) = \sigma^2 = E[(X-\mu)^2] = \sum_{i} (x_i - \mu)^2 p(x_i) $$ 一个更便于计算的公式是: $$ Var(X) = E[X^2] - (E[X])^2 = \left( \sum_{i} x_i^2 p(x_i) \right) - \mu^2 $$

{{{标准差}}},用 $\sigma$ 表示,是方差的平方根 ($\sigma = \sqrt{Var(X)}$)。它的优点是与随机变量本身具有相同的量纲(单位),因此在解释上更为直观。

## 常见的离散概率分布

在理论和实践中,有几种离散概率分布因其广泛的适用性而变得非常重要。

### 1. 伯努利分布 (Bernoulli Distribution)

* 描述:描述一次只有两个可能结果(通常称为“{{{成功}}}”与“{{{失败}}}”)的单一试验。这是最简单的离散分布。 * 参数:$p$,表示“成功”的概率 ($0 \le p \le 1$)。 * PMF:$P(X=x) = p^x (1-p)^{1-x}$,其中 $x \in \{0, 1\}$ (通常 1 代表成功,0 代表失败)。 * 期望值:$E[X] = p$ * 方差:$Var(X) = p(1-p)$ * 示例:抛掷一次硬币,记录正面向上的结果(如正面为成功)。

### 2. 二项分布 (Binomial Distribution)

* 描述:描述在一系列固定的 $n$ 次独立同分布的 {{{伯努利试验}}} 中,“成功”的总次数。 * 参数:$n$ (试验次数) 和 $p$ (单次试验的成功概率)。 * PMF:$P(X=k) = \binom{n}{k} p^k (1-p)^{n-k}$,其中 $k \in \{0, 1, $...$, n\}$。$\binom{n}{k} = \frac{n!}{k!(n-k)!}$ 是 {{{二项式系数}}},表示从 $n$ 次试验中选出 $k$ 次成功的所有组合方式。 * 期望值:$E[X] = np$ * 方差:$Var(X) = np(1-p)$ * 示例:抛掷10次硬币,记录正面朝上的次数。

### 3. 泊松分布 (Poisson Distribution)

* 描述:描述在一个固定的时间间隔、空间区域或任何其他测量单位内,某个事件发生的次数。它假设事件是独立发生的,且发生速率是恒定的。 * 参数:$\lambda$ (lambda),表示在给定单位内事件的平均发生率。 * PMF:$P(X=k) = \frac{\lambda^k e^{-\lambda}}{k!}$,其中 $k \in \{0, 1, 2, $...$\}$。 * 期望值:$E[X] = \lambda$ * 方差:$Var(X) = \lambda$ * 示例:一个呼叫中心在1小时内接到的电话数量;一段DNA上发生的突变数量。

### 4. 几何分布 (Geometric Distribution)

* 描述:描述在一系列独立的 {{{伯努利试验}}} 中,为获得第一次“成功”所需要的试验次数。 * 参数:$p$ (单次试验的成功概率)。 * PMF:$P(X=k) = (1-p)^{k-1} p$,其中 $k \in \{1, 2, 3, $...$\}$。 * 期望值:$E[X] = 1/p$ * 方差:$Var(X) = (1-p)/p^2$ * 示例:反复掷骰子,直到第一次掷出6点所需的次数。

### 5. 超几何分布 (Hypergeometric Distribution)

* 描述:描述从一个包含 $K$ 个“成功”元素和 $N-K$ 个“失败”元素的有限总体 $N$ 中,进行 $n$ 次 不放回 抽样,所得到的“成功”元素的数量。 * 参数:$N$ (总体大小),$K$ (总体中的成功元素数量),$n$ (抽样数量)。 * PMF:$P(X=k) = \frac{\binom{K}{k} \binom{N-K}{n-k}}{\binom{N}{n}}$。 * 与二项分布的区别:{{{超几何分布}}} 用于不放回抽样,各次试验不是独立的;当总体大小 $N$ 相对于样本大小 $n$ 很大时,它近似于 {{{二项分布}}}。 * 示例:从一副52张的扑克牌中随机抽取5张,其中抽到A的数量。

## 累积分布函数 (Cumulative Distribution Function, CDF)

对于一个离散随机变量 $X$,其 {{{累积分布函数}}} (Cumulative Distribution Function, CDF),记为 $F(x)$,定义为随机变量 $X$ 的取值小于或等于 $x$ 的概率。

$$ F(x) = P(X \le x) = \sum_{x_i \le x} p(x_i) $$

CDF 具有以下特性: * 它是一个非减函数。 * 对于离散随机变量,其图形呈现为阶梯状({{{阶跃函数}}})。 * $\lim_{x \to -\infty} F(x) = 0$ 且 $\lim_{x \to \infty} F(x) = 1$。 * CDF 可以方便地计算变量落在某个区间内的概率,例如 $P(a < X \le b) = F(b) - F(a)$。