ARTICLE

洛伦兹分布

洛伦兹分布 (Cauchy / Lorentz Distribution) 洛伦兹分布，在数学中通常称为柯西分布（Cauchy Distribution），在物理学中称为洛伦兹分布或布赖特-维格纳分布（Breit-Wigner Distribution），是一类在概率论、统计学和物理学中都具有重要地位的连续概率分布。它的最显著特征是厚尾性（heavy tai

浏览 0 更新 2025-10-26

洛伦兹分布 (Cauchy / Lorentz Distribution)

洛伦兹分布，在数学中通常称为柯西分布（Cauchy Distribution），在物理学中称为洛伦兹分布或布赖特-维格纳分布（Breit-Wigner Distribution），是一类在概率论、统计学和物理学中都具有重要地位的连续概率分布。它的最显著特征是厚尾性（heavy tails）——尾部衰减足够缓慢，以至于其期望值、方差及所有高阶矩均不存在或发散。这一反直觉的特性使其成为概率论教学中说明"矩可能不存在"的经典案例，同时在物理学中用于描述共振现象（如光谱线的洛伦兹展宽），在统计学中则作为稳健统计的极端检验基准。

定义与参数化

洛伦兹分布由位置参数 $x_0$ （中位数和众数的位置）和尺度参数 $\gamma>0$ （半峰半宽，即半高宽的一半）完全确定。其概率密度函数（PDF）为：

f(x; x_0, \gamma) = \frac{1}{\pi\gamma}\frac{1}{1 + \left(\frac{x - x_0}{\gamma}\right)^2},\quad x \in \mathbb{R}

PDF在 $x = x_0$ 处取得峰值 $1/(\pi\gamma)$ 。由于分母为二次型，尾部以 $1/x^2$ 速率衰减，这比正态分布的指数衰减慢得多，造成矩的不存在。

累积分布函数（CDF）为：

F(x; x_0, \gamma) = \frac{1}{\pi}\arctan\left(\frac{x - x_0}{\gamma}\right) + \frac{1}{2}

这是一个光滑、严格递增的函数，其反函数给出了显式的分位数函数：

Q(p; x_0, \gamma) = x_0 + \gamma\tan\left[\pi\left(p - \frac{1}{2}\right)\right],\quad 0 < p < 1

该分位数的显式形式使得从洛伦兹分布中生成随机样本极为简便——只需生成标准均匀分布随机数 $U\sim U(0,1)$ ，再代入 $X = x_0 + \gamma\tan[\pi(U - 1/2)]$ 即可。

矩与矩的缺失

洛伦兹分布最为人所知的性质是其矩的缺失。对于标准洛伦兹分布（ $x_0=0,\;\gamma=1$ ），期望值的积分

E[X] = \int_{-\infty}^{\infty} \frac{x}{\pi(1+x^2)}dx

在柯西主值意义下为0，但作为勒贝格积分则发散——正负两部分各发散至无穷。这意味着传统的大数定律不适用于从洛伦兹分布中抽取的样本：无论样本量多大，样本均值的分布始终与单个观测的分布相同（都是标准柯西分布）。这一性质可由特征函数直接看出：

\varphi_X(t) = E[e^{itX}] = e^{i x_0 t - \gamma |t|}

特征函数在 $t=0$ 处不可导，进一步印证了矩的不存在性。方差、偏度、峰度均无定义。然而，中位数和众数均有良好定义且等于 $x_0$ ；四分位距为 $2\gamma$ 。

与其它分布的关系

洛伦兹分布与多种重要分布存在深刻联系。

与t分布的关系：标准洛伦兹分布恰好是t分布在自由度为1时的特例。事实上，t分布的自由度越小，尾部越厚；当自由度为1时，尾部厚到矩不再存在。因此，洛伦兹分布可视为t分布在最极端情形下的退化。

与正态分布的关系：若 $X\sim N(0,1)$ 和 $Y\sim N(0,1)$ 是两个独立的标准正态分布随机变量，则比值 $Z = X/Y$ 服从标准洛伦兹分布。这一性质在计量经济学中极为重要——当两个独立正态变量的比值作为工具变量或弱识别统计量出现时，其分布可能出现类似洛伦兹分布的厚尾行为，导致传统的t检验失效。此外，若 $X\sim N(0,1)$ ，则 $1/X$ 的分布也是洛伦兹分布，这一性质在物理学中十分常见。

与均匀分布的关系：如前所述，通过对均匀分布应用正切变换即可得到洛伦兹分布，这提供了最简单的随机数生成方法。

与稳定分布的关系：洛伦兹分布属于稳定分布族，其特征指数 $\alpha=1$ 、偏度参数 $\beta=0$ 、尺度参数 $\sigma=\gamma$ 、位置参数 $\delta=x_0$ 。稳定分布族中只有正态分布（ $\alpha=2$ ）、洛伦兹分布（ $\alpha=1$ ）和莱维分布（ $\alpha=0.5$ ）具有封闭形式的PDF。

物理学中的洛伦兹分布

在物理学（特别是光谱学和原子物理）中，洛伦兹分布描述了受自然展宽（而非多普勒展宽）主导的光谱线型。原子激发态具有有限的寿命 $\tau$ ，根据海森堡不确定性原理，能级具有自然宽度 $\Gamma = \hbar/\tau$ ，这直接对应于洛伦兹分布的尺度参数。由此导出的谱线形状为：

I(E) \propto \frac{1}{(E - E_0)^2 + (\Gamma/2)^2}

其中 $E_0$ 是共振能量。这种线型称为洛伦兹线型（Lorentzian Line Shape），与之相对的是由热运动导致的高斯线型（多普勒展宽）。在实际光谱拟合中，常常使用两者的卷积——沃伊特线型（Voigt Profile）——来同时考虑自然展宽和多普勒展宽。

在高能物理中，布赖特-维格纳分布描述了不稳定粒子的共振截面，如 $\rho$ 介子和 $Z$ 玻色子的质量分布。介子共振的宽度直接反映了其寿命。

统计学中的洛伦兹分布

在统计学中，洛伦兹分布具有多重角色。首先，它是稳健统计中的极端情形——由于矩不存在，任何基于样本均值的估计方法都会完全失效，但基于中位数和分位数的估计则仍可正常工作。具体而言，样本中位数是 $x_0$ 的一致估计量，且其渐进分布为正态分布，标准差约为 $\pi\gamma/(2\sqrt{n})$ ——尽管每个观测值都是厚尾的，中位数的收敛速度仍然不慢。

其次，洛伦兹分布在贝叶斯统计中作为无信息先验出现。对于位置参数 $x_0$ ，其平直先验（即均匀先验）对应于一个非正常先验。在某种参数化下，尺度参数 $\gamma$ 的杰弗里斯先验（Jeffreys Prior）恰好是 $p(\gamma) \propto 1/\gamma$ ，这导致后验分布为洛伦兹分布。

第三，在计量经济学和金融中，洛伦兹分布被用作厚尾分布的备择模型。金融资产收益率常常呈厚尾分布，虽然洛伦兹分布因其矩的缺失而过于极端，但它提供了一个重要的理论参照——如果数据的经验分布与洛伦兹分布同样厚尾，则关于方差存在的所有标准结论（如中心极限定理的适用性）都需要重新审视。

参数估计

由于矩不存在，矩估计法对洛伦兹分布完全失效。常用的参数估计方法包括：

最大似然估计（MLE）：对于样本 $x_1,\ldots,x_n$ ，对数似然函数为：

\ell(x_0,\gamma) = -n\ln(\pi\gamma) - \sum_{i=1}^{n}\ln\left[1 + \left(\frac{x_i - x_0}{\gamma}\right)^2\right]

MLE没有封闭形式，必须通过数值优化求解。似然函数可能具有多个局部极值，但总体而言MLE是一致估计量且渐进有效。

分位数估计：利用样本中位数 $\tilde{x}$ 估计 $x_0$ ，利用样本四分位距 $\text{IQR}$ 估计 $2\gamma$ 。这些估计量虽然在有限样本下效率不如MLE，但计算简单且对异常值不敏感。

经验特征函数法：基于特征函数 $\varphi(t)=e^{i x_0 t - \gamma|t|}$ ，对多个频率点 $t_j$ 的样本特征函数进行拟合。这一方法可避免似然函数的多峰问题，近年来受到越来越多的关注。

数值计算与模拟

在实际应用中，计算洛伦兹分布的PDF和CDF直接利用上述封闭公式即可。对于随机数生成，使用逆变换法——生成 $U\sim U(0,1)$ ，再计算 $X = x_0 + \gamma\tan[\pi(U-0.5)]$ ——最为简便高效。

需要注意的是，在生成接近±1的均匀随机数时，正切函数可能产生极大的数值，这在模拟中恰好反映了洛伦兹分布的厚尾特性——极值观测虽然在概率上很小，但一旦出现其数值可能比正态分布情形大若干数量级。因此，在涉及蒙特卡洛模拟时，若样本量不够大，少数极端值可能主导模拟结果，导致传统的大数定律推论失效。一个经验法则是：使用洛伦兹分布进行模拟时，中位数和分位数的蒙特卡洛误差远小于样本均值的误差，因此应优先使用基于分位数的统计量。

变体与扩展

截断洛伦兹分布：在特定区间 $[a,b]$ 上截断的洛伦兹分布，其PDF为：

f_T(x) = \frac{f(x)}{F(b)-F(a)},\quad a \leq x \leq b

此时矩存在——因为截断消除了尾部发散。截断洛伦兹分布在信号处理中用于拟合混叠光谱。

多变量洛伦兹分布：多变量情形通常定义为椭圆分布族的一种，其密度函数为：

f(\mathbf{x}) \propto \left[1 + (\mathbf{x} - \boldsymbol{\mu})^T \Sigma^{-1} (\mathbf{x} - \boldsymbol{\mu})\right]^{-(p+1)/2}

其中 $p$ 为维度。多变量洛伦兹分布的边缘分布和条件分布仍为洛伦兹分布，但条件方差不再恒定——这与多元正态分布有本质区别。

偏洛伦兹分布：通过在 $\tan$ 变换中引入额外参数，可以构造具有非对称性的偏洛伦兹分布，用于拟合具有不对称厚尾特征的数据。

洛伦兹分布以其反直觉的统计性质和在物理学中的核心地位，成为概率论与数理统计教学中不可或缺的案例。它的存在提醒我们：并非所有由CDF良好定义的分布都具有常规的矩；当数据呈现极端厚尾时，中位数和分位数比均值更可靠。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。