ARTICLE

泊松极限定理

泊松极限定理 定义与直观理解 泊松极限定理(Poisson limit theorem),亦称泊松逼近或小数定律(law of rare events),是概率论中的一个经典极限定理。它指出:当试验次数 n 很大,且每次试验的成功概率 p 很小,使得乘积 = np 保持一个适中的常数时,二项分布 Binomial(n, p) 收敛到泊松分布 Poisson(

浏览 3 更新 2025-10-26

泊松极限定理

定义与直观理解

泊松极限定理(Poisson limit theorem),亦称泊松逼近小数定律(law of rare events),是概率论中的一个经典极限定理。它指出:当试验次数 n n 很大,且每次试验的成功概率 p p 很小,使得乘积 λ=np \lambda = np 保持一个适中的常数时,二项分布 Binomial(n,p) \mathrm{Binomial}(n, p) 收敛到泊松分布 Poisson(λ) \mathrm{Poisson}(\lambda) 。这一结论的核心思想在于:稀有事件在大量独立重复试验中发生的总次数,其概率分布趋向于一个仅与期望值 λ \lambda 相关的简单形式,而与 n n p p 的具体取值无关。

数学表述如下:设随机变量 XnBinomial(n,pn) X_n \sim \mathrm{Binomial}(n, p_n) ,且 limnnpn=λ>0 \lim_{n\to\infty} n p_n = \lambda > 0 ,则对任意非负整数 k k ,有

limnPr(Xn=k)=λkeλk!.\lim_{n\to\infty} \Pr(X_n = k) = \frac{\lambda^k e^{-\lambda}}{k!}.

这意味着,当 n n 足够大而 p p 足够小时,二项分布的概率可以通过泊松分布的概率来近似计算,从而避免了涉及大阶乘和组合数的复杂运算。

证明

考虑二项分布的概率质量函数:

Pr(Xn=k)=(nk)pnk(1pn)nk.\Pr(X_n = k) = \binom{n}{k} p_n^k (1-p_n)^{n-k}.

λn=npn \lambda_n = n p_n ,则 pn=λn/n p_n = \lambda_n / n 。代入上式:

Pr(Xn=k)=(nk)(λnn)k(1λnn)nk=n(n1)(nk+1)k!λnknk(1λnn)nk=λnkk!nnn1nnk+1n(1λnn)n(1λnn)k.\begin{aligned} \Pr(X_n = k) &= \binom{n}{k} \left(\frac{\lambda_n}{n}\right)^k \left(1 - \frac{\lambda_n}{n}\right)^{n-k} \\ &= \frac{n(n-1)\cdots(n-k+1)}{k!} \cdot \frac{\lambda_n^k}{n^k} \left(1 - \frac{\lambda_n}{n}\right)^{n-k} \\ &= \frac{\lambda_n^k}{k!} \cdot \frac{n}{n} \cdot \frac{n-1}{n} \cdots \frac{n-k+1}{n} \cdot \left(1 - \frac{\lambda_n}{n}\right)^n \cdot \left(1 - \frac{\lambda_n}{n}\right)^{-k}. \end{aligned}

n n \to \infty 时,λnλ \lambda_n \to \lambda ,且

nnn1nnk+1n=1(11n)(1k1n)1,\frac{n}{n} \cdot \frac{n-1}{n} \cdots \frac{n-k+1}{n} = 1 \cdot \left(1 - \frac{1}{n}\right) \cdots \left(1 - \frac{k-1}{n}\right) \to 1,
(1λnn)neλ,\left(1 - \frac{\lambda_n}{n}\right)^n \to e^{-\lambda},
(1λnn)k1.\left(1 - \frac{\lambda_n}{n}\right)^{-k} \to 1.

因此,

limnPr(Xn=k)=λkk!eλ.\lim_{n\to\infty} \Pr(X_n = k) = \frac{\lambda^k}{k!} e^{-\lambda}.

证毕。上述证明的关键步骤在于利用了经典极限 limn(1+x/n)n=ex \lim_{n\to\infty} (1 + x/n)^n = e^x ,以及当 k k 固定时比值 n(n1)(nk+1)/nk n(n-1)\cdots(n-k+1)/n^k 趋近于 1 1 这一事实。

历史背景

泊松极限定理由法国数学家西莫恩·德尼·泊松(Siméon Denis Poisson)在其 1837 年的著作《关于刑事和民事判决的概率研究》(*Recherches sur la probabilité des jugements en matière criminelle et en matière civile*)中首次提出。泊松是概率论发展史上的重要人物,他在拉普拉斯工作的基础上,将概率方法系统性地应用于社会科学领域。泊松在研究陪审团判决的概率问题时,注意到当 n n 很大而 p p 很小时,二项分布的计算变得极其繁琐,因此推导出了这一近似公式。

有趣的是,该定理在相当长一段时间内并未引起足够重视。直到 20 世纪初,俄国数学家马尔可夫(Andrey Markov)将其应用于独立随机变量求和的研究,并为大数定律和中心极限定理的严格化奠定了基础,泊松极限定理才重新进入概率论研究的核心视野。如今,该定理被认为是连接离散概率分布与连续概率过程的桥梁之一,也是学习随机过程理论的必要前置知识。

应用场景与典型例子

泊松极限定理在实际应用中极为广泛,其核心价值在于用简单分布近似复杂分布,尤其在以下场景中发挥着关键作用:

1. 稀有事件建模

当事件发生的概率 p p 很小(例如 p<0.05 p < 0.05 )而试验次数 n n 很大(例如 n>100 n > 100 )时,二项分布的概率计算涉及巨大的组合数,计算量极大。泊松逼近大大简化了计算,且误差可控。常见例子包括:

  • 保险精算:某人在一年内发生交通事故的概率很小,但投保人数众多,全年事故次数服从泊松分布。保险公司利用这一模型计算保费和准备金。
  • 质量控制:产品缺陷率很低时,批量生产中缺陷品数量可用泊松分布描述,从而制定合理的抽样检验方案。
  • 医学统计:某种罕见疾病在人群中的发病率较低,一定人口规模下的病例数可建模为泊松分布,用于流行病学监测。

2. 排队论与流量工程

  • 电话交换系统中,单位时间内来电数量通常服从泊松分布,这是电话通信系统设计的理论基础。
  • 网络数据包到达服务器的时间间隔分布,广泛用于互联网流量建模。
  • 银行柜台、超市收银台等服务的顾客到达过程,可用泊松过程描述以优化资源配置。

3. 自然现象

  • 放射性衰变中单位时间内衰变的原子数,这是核物理实验中的经典模型。
  • 显微镜视野中细菌或血细胞的数量,用于生物医学计数。
  • 某区域内植物或动物的空间分布模式,在生态学中用于判断分布是否为随机型。

逼近精度与误差界

泊松逼近的误差可以用以下不等式刻画:

k=0PrBin(k)PrPois(k)2np2.\sum_{k=0}^{\infty} \left| \Pr_{\mathrm{Bin}}(k) - \Pr_{\mathrm{Pois}}(k) \right| \leq 2n p^2.

更精确的结果由Le Cam 定理给出。该定理适用于各次试验成功概率 pi p_i 可能不同的更一般情形(即泊松二项分布):

k=0PrBin(k)PrPois(k)2i=1npi2.\sum_{k=0}^{\infty} \left| \Pr_{\mathrm{Bin}}(k) - \Pr_{\mathrm{Pois}}(k) \right| \leq 2 \sum_{i=1}^n p_i^2.

当所有 pi p_i 相等时,上界退化为 2np2 2np^2 。实际应用的经验法则是:当 p0.1 p \leq 0.1 n30 n \geq 30 时,泊松近似的精度已经相当理想;若 p0.05 p \leq 0.05 n50 n \geq 50 ,则误差通常可以忽略不计。

与其他极限定理的关系

泊松极限定理、大数定律和中心极限定理共同构成了概率论中三大经典极限定理:

| 定理 | 适用条件 | 收敛目标 | |------|---------|---------| | 大数定律 | n n \to \infty p p 固定 | 样本均值收敛到期望值 | | 中心极限定理 | n n \to \infty p p 固定 | 标准化二项分布收敛到正态分布 | | 泊松极限定理 | n n \to \infty p0 p \to 0 npλ np \to \lambda | 二项分布收敛到泊松分布 |

三者各有其适用场景:当 p p 固定而 n n 很大时,使用正态近似;当 p p 很小而 n n 很大时,使用泊松近似更为精确。值得注意的是,当 λ \lambda 较大(例如 λ>20 \lambda > 20 )时,泊松分布本身又可以由正态分布近似,这体现了三大定理之间的内在联系。

扩展:泊松过程

泊松极限定理为泊松过程提供了理论基础。考虑时间区间 [0,T] [0, T] 上的事件计数,将其等分为 n n 个子区间,每个子区间内事件发生的概率为 λT/n \lambda T / n 。当 n n \to \infty 时,子区间内至多发生一个事件,且总事件数服从 Poisson(λT) \mathrm{Poisson}(\lambda T) 分布。由此可导出泊松过程的基本性质,包括平稳独立增量性和事件间隔时间的指数分布特性。泊松过程是随机过程理论中最基本的计数过程,广泛应用于物理、生物、金融和工程领域。

参考文献

  1. Poisson, S. D. (1837). *Recherches sur la probabilité des jugements en matière criminelle et en matière civile*. Paris: Bachelier.
  2. Le Cam, L. (1960). "An approximation theorem for the Poisson binomial distribution". *Pacific Journal of Mathematics*, 10(4), 1181–1197.
  3. Feller, W. (1968). *An Introduction to Probability Theory and Its Applications*, Vol. 1 (3rd ed.). John Wiley \& Sons.
  4. 陈希孺. (2009). 《概率论与数理统计》. 中国科学技术大学出版社.
  5. 茆诗松, 程依明, 濮晓龙. (2011). 《概率论与数理统计教程》(第 2 版). 高等教育出版社.