# 满足可加性的分布函数汇总 (Distributions with Additive Property)
在{{{概率论}}}和{{{统计学}}}中,分布的 可加性 (Additive Property),也称为 再生性 (Reproductive Property) 或 闭包性 (Closure Property under Addition),是一个非常重要的性质。它描述了某些{{{概率分布}}}家族的一个特征:若多个独立的{{{随机变量}}}均服从同一分布族,那么它们的和的分布仍然属于这个家族。
这个性质极大地简化了对随机变量之和的分析,在理论研究和实际应用中都扮演着核心角色。正式地,如果独立随机变量 $X_1, X_2, \dots, X_n$ 分别服从参数为 $\theta_1, \theta_2, \dots, \theta_n$ 的某一分布族,即 $X_i \sim \text{Dist}(\theta_i)$,它们的和 $S_n = X_1 + X_2 + \dots + X_n$ 的分布仍然属于该分布族,即 $S_n \sim \text{Dist}(\theta_{new})$,那么我们就称这个分布族 "Dist" 满足可加性。其中,新参数 $\theta_{new}$ 通常是原参数 $\theta_1, \dots, \theta_n$ 的一个简单函数(如求和)。
证明分布可加性的一个常用工具是{{{矩母函数}}} (Moment-Generating Function, MGF) 或{{{特征函数}}} (Characteristic Function)。因为对于独立的随机变量 $X_1, \dots, X_n$,其和 $S_n$ 的矩母函数等于各个随机变量矩母函数的乘积: $$ M_{S_n}(t) = M_{X_1 + \dots + X_n}(t) = \prod_{i=1}^{n} M_{X_i}(t) $$ 如果这个乘积的形式与该分布族的原始矩母函数形式相同(只是参数不同),则证明了该分布族的可加性。
以下汇总了几个常见的满足可加性的重要分布。
## 离散型分布 (Discrete Distributions)
### 1. 二项分布 (Binomial Distribution) 性质: 独立{{{二项分布}}}随机变量之和,当且仅当它们的成功概率 $p$ 相同时,仍然服从二项分布。
形式化表述: 假设 $X_1, X_2, \dots, X_k$ 是 $k$ 个独立的随机变量,且 $X_i \sim B(n_i, p)$ for $i=1, \dots, k$。这里 $n_i$ 是第 $i$ 个实验的试验次数,$p$ 是每次试验的成功概率。那么,它们的和 $S_k = \sum_{i=1}^{k} X_i$ 服从一个新的二项分布: $$ S_k \sim B\left(\sum_{i=1}^{k} n_i, p\right) $$ 参数变化: 新的试验次数是原试验次数之和,成功概率 $p$ 保持不变。 注意: 这个性质要求所有随机变量的成功概率 $p$ 必须相同。直观上,这相当于将多组独立的伯努利试验合并为一组更长的试验。{{{伯努利分布}}} $B(1, p)$ 是二项分布的特例,因此 $n$ 个独立同分布的伯努利随机变量之和服从 $B(n, p)$。
### 2. 泊松分布 (Poisson Distribution) 性质: 任意多个独立{{{泊松分布}}}随机变量之和仍然服从泊松分布。
形式化表述: 假设 $X_1, X_2, \dots, X_n$ 是 $n$ 个独立的随机变量,且 $X_i \sim \text{Pois}(\lambda_i)$。这里 $\lambda_i$ 是单位时间(或空间)内事件发生的平均次数。那么,它们的和 $S_n = \sum_{i=1}^{n} X_i$ 服从一个新的泊松分布: $$ S_n \sim \text{Pois}\left(\sum_{i=1}^{n} \lambda_i\right) $$ 参数变化: 新的速率参数 $\lambda$ 是原速率参数之和。 应用: 这个性质在建模中非常有用。例如,如果来自不同来源的电话呼叫分别服从泊松分布,那么呼叫中心收到的总呼叫数也服从泊松分布。这是{{{泊松过程}}}的一个基本特征。
### 3. 负二项分布 (Negative Binomial Distribution) 性质: 独立{{{负二项分布}}}随机变量之和,当且仅当它们的成功概率 $p$ 相同时,仍然服从负二项分布。
形式化表述: 假设 $X_1, X_2, \dots, X_k$ 是 $k$ 个独立的随机变量,且 $X_i \sim NB(r_i, p)$,表示为了取得 $r_i$ 次成功所需的试验次数。那么,它们的和 $S_k = \sum_{i=1}^{k} X_i$ 服从一个新的负二项分布: $$ S_k \sim NB\left(\sum_{i=1}^{k} r_i, p\right) $$ 参数变化: 新的成功次数目标是原成功次数目标之和,成功概率 $p$ 保持不变。 特例: {{{几何分布}}}是负二项分布当 $r=1$ 时的特例。因此,$r$ 个独立同分布于 $Geom(p)$ 的随机变量之和服从 $NB(r, p)$。
## 连续型分布 (Continuous Distributions)
### 1. 正态分布 (Normal Distribution) 性质: 任意多个独立{{{正态分布}}}随机变量的线性组合(包括和)仍然服从正态分布。这是正态分布最重要和最著名的性质之一。
形式化表述: 假设 $X_1, X_2, \dots, X_n$ 是 $n$ 个独立的随机变量,且 $X_i \sim N(\mu_i, \sigma_i^2)$。它们的和 $S_n = \sum_{i=1}^{n} X_i$ 服从一个新的正态分布: $$ S_n \sim N\left(\sum_{i=1}^{n} \mu_i, \sum_{i=1}^{n} \sigma_i^2\right) $$ 参数变化: 和的{{{期望}}}是各期望之和,和的{{{方差}}}是各方差之和。 推广: 更一般地,对于常数 $a_1, \dots, a_n$,线性组合 $\sum_{i=1}^{n} a_i X_i$ 也服从正态分布: $$ \sum_{i=1}^{n} a_i X_i \sim N\left(\sum_{i=1}^{n} a_i \mu_i, \sum_{i=1}^{n} a_i^2 \sigma_i^2\right) $$ 这个性质是{{{中心极限定理}}}的核心基础,并且在{{{金融学}}}的资产组合理论和{{{统计推断}}}中无处不在。
### 2. 伽马分布 (Gamma Distribution) 性质: 独立{{{伽马分布}}}随机变量之和,当且仅当它们的尺度参数 $\beta$ (或速率参数 $\theta=1/\beta$) 相同时,仍然服从伽马分布。
形式化表述: 使用形状-尺度参数化 $(\alpha, \beta)$。假设 $X_1, X_2, \dots, X_n$ 是 $n$ 个独立的随机变量,且 $X_i \sim \Gamma(\alpha_i, \beta)$。那么,它们的和 $S_n = \sum_{i=1}^{n} X_i$ 服从一个新的伽马分布: $$ S_n \sim \Gamma\left(\sum_{i=1}^{n} \alpha_i, \beta\right) $$ 参数变化: 新的形状参数 $\alpha$ 是原形状参数之和,尺度参数 $\beta$ 保持不变。 关联: {{{指数分布}}} $Exp(\lambda)$ 是伽马分布 $\Gamma(1, 1/\lambda)$ 的特例。因此,$n$ 个独立同分布于 $Exp(\lambda)$ 的随机变量之和服从伽马分布 $\Gamma(n, 1/\lambda)$。注意,和的分布是伽马分布而不是指数分布(除非 $n=1$),所以指数分布族自身不满足可加性。
### 3. 卡方分布 (Chi-squared Distribution) 性质: 任意多个独立{{{卡方分布}}}随机变量之和仍然服从卡方分布。
形式化表述: 假设 $X_1, X_2, \dots, X_n$ 是 $n$ 个独立的随机变量,且 $X_i \sim \chi^2(k_i)$,其中 $k_i$ 是自由度。那么,它们的和 $S_n = \sum_{i=1}^{n} X_i$ 服从一个新的卡方分布: $$ S_n \sim \chi^2\left(\sum_{i=1}^{n} k_i\right) $$ 参数变化: 新的自由度是原自由度之和。 推论: 由于卡方分布是伽马分布的一个特例($\chi^2(k) \equiv \Gamma(k/2, 2)$),这个性质可以直接从伽马分布的可加性推导出来。它在{{{假设检验}}}中至关重要,例如在合并多个卡方检验统计量时。
### 4. 柯西分布 (Cauchy Distribution) 性质: 独立{{{柯西分布}}}随机变量的线性组合仍然服从柯西分布。特别地,独立同分布的柯西随机变量的算术平均值与单个随机变量具有完全相同的分布。
形式化表述: 假设 $X_1, \dots, X_n$ 是 $n$ 个独立的随机变量,且 $X_i \sim \text{Cauchy}(x_{0i}, \gamma_i)$。它们的和 $S_n=\sum_{i=1}^n X_i$ 服从一个新的柯西分布: $$ S_n \sim \text{Cauchy}\left(\sum_{i=1}^n x_{0i}, \sum_{i=1}^n \gamma_i\right) $$ 参数变化: 新的位置参数 $x_0$ 是原位置参数之和,新的尺度参数 $\gamma$ 是原尺度参数之和。 重要特例: 如果 $X_i$ 独立同分布于 $\text{Cauchy}(x_0, \gamma)$,则样本均值 $\bar{X} = \frac{1}{n}\sum_{i=1}^n X_i$ 的分布为: $$ \bar{X} \sim \text{Cauchy}(x_0, \gamma) $$ 这表明柯西分布不服从{{{大数定律}}},其样本均值不会收敛到期望值(因为柯西分布的期望不存在)。
## 不满足可加性的分布 了解哪些常见分布不满足可加性同样重要,这有助于避免错误假设。
* {{{均匀分布}}} (Uniform Distribution): 两个独立同分布的均匀随机变量 $U(0,1)$ 的和服从{{{三角分布}}},而不是均匀分布。 * {{{指数分布}}} (Exponential Distribution): 如前所述,独立同分布的指数随机变量之和服从伽马分布,而非指数分布。 * 逻辑斯谛分布 (Logistic Distribution): 和的分布不是逻辑斯谛分布。 * F分布 (F-distribution) 和 t分布 (t-distribution): 它们本身是其他分布的商或组合,不具有简单的可加性。