ARTICLE

正态分布 (Normal Distribution)

正态分布 (Normal Distribution) 正态分布,又称高斯分布 (Gaussian Distribution),是概率论与统计学中最为核心的连续概率分布。由 Abraham de Moivre 于1733年首次引入(作为二项分布的极限),后由高斯 (Carl Friedrich Gauss) 在天文学测量误差建模中系统发展,最终由拉普拉斯在中心

浏览 1 更新 2025-10-26

正态分布 (Normal Distribution)

正态分布,又称高斯分布 (Gaussian Distribution),是概率论与统计学中最为核心的连续概率分布。由 Abraham de Moivre 于1733年首次引入(作为二项分布的极限),后由高斯 (Carl Friedrich Gauss) 在天文学测量误差建模中系统发展,最终由拉普拉斯在中心极限定理框架下奠定其理论基础。正态分布不仅是大量自然和社会现象的统计模型,更是计量经济学中绝大多数推断方法——从最小二乘估计到假设检验——的基石。

定义与概率密度函数

若随机变量 XX 服从均值为 μ\mu、方差为 σ2\sigma^2 的正态分布,记为 XN(μ,σ2)X \sim N(\mu, \sigma^2),其概率密度函数为:

f(xμ,σ2)=12πσ2exp[(xμ)22σ2],xRf(x \mid \mu, \sigma^2) = \frac{1}{\sqrt{2\pi\sigma^2}} \exp\left[-\frac{(x-\mu)^2}{2\sigma^2}\right], \quad x \in \mathbb{R}

其中 μR\mu \in \mathbb{R} 为位置参数,决定分布的对称中心;σ>0\sigma > 0 为尺度参数,控制分布的离散程度。该函数具有经典的钟形曲线形态:在 x=μx = \mu 处取得最大值 1/2πσ21/\sqrt{2\pi\sigma^2},在 x=μ±σx = \mu \pm \sigma 处有拐点,两侧以指数速率衰减,形成薄尾。

矩与性质

正态分布的所有矩均存在。一阶原点矩为 E[X]=μ\mathbb{E}[X] = \mu;二阶中心矩为 Var(X)=σ2\operatorname{Var}(X) = \sigma^2。由于密度函数的对称性,所有奇数阶中心矩均为零,偏度 S=0S = 0。偶数阶中心矩由 E[(Xμ)2k]=σ2k(2k1)!!\mathbb{E}[(X-\mu)^{2k}] = \sigma^{2k}(2k-1)!! 给出,因此峰度(超额峰度)K=0K = 0——正态分布是所有分布的峰度基准。

正态分布的关键性质包括:

  • 线性不变性:若 XN(μ,σ2)X \sim N(\mu, \sigma^2),则对任意常数 a,ba, b,有 aX+bN(aμ+b,a2σ2)aX + b \sim N(a\mu+b, a^2\sigma^2)。这意味着正态随机变量的线性变换仍是正态的——这是很多推导得以成立的前提。
  • 独立可加性:若 X1,,XnX_1, \ldots, X_n 相互独立且 XiN(μi,σi2)X_i \sim N(\mu_i, \sigma_i^2),则 XiN(μi,σi2)\sum X_i \sim N\left(\sum \mu_i, \sum \sigma_i^2\right)
  • 独立性等价于零协方差:对于联合正态分布,边际独立等价于协方差为零,这是正态分布独有的性质(一般分布中协方差为零不蕴含独立)。

标准正态分布与Z变换

μ=0\mu = 0σ=1\sigma = 1 时,称为标准正态分布 N(0,1)N(0, 1),其密度记为 ϕ(z)=12πez2/2\phi(z) = \frac{1}{\sqrt{2\pi}} e^{-z^2/2},累积分布函数记为 Φ(z)=zϕ(t)dt\Phi(z) = \int_{-\infty}^{z} \phi(t)\,dt。通过标准化变换 Z=(Xμ)/σZ = (X - \mu)/\sigma,任意正态变量可化为标准正态,Φ(z)\Phi(z) 的值可查标准正态表获得。关键分位点:

Φ1(0.975)1.96,Φ1(0.995)2.58\Phi^{-1}(0.975) \approx 1.96, \quad \Phi^{-1}(0.995) \approx 2.58

对应计量经济学中最常见的 95%95\%99%99\% 置信水平临界值。函数 Φ()\Phi(\cdot) 不存在闭合解析式,但可通过误差函数 erf(x)=2π0xet2dt\operatorname{erf}(x) = \frac{2}{\sqrt{\pi}}\int_0^x e^{-t^2}\,dt 表示:Φ(z)=12[1+erf ⁣(z2)]\Phi(z) = \frac{1}{2}\left[1 + \operatorname{erf}\!\left(\frac{z}{\sqrt{2}}\right)\right]

中心极限定理

正态分布的核心地位主要源于中心极限定理 (Central Limit Theorem):设 X1,X2,,XnX_1, X_2, \ldots, X_n 是独立同分布(i.i.d.)的随机变量,具有有限均值 μ\mu 和有限方差 σ2>0\sigma^2 > 0,则样本均值的标准化形式依分布收敛于标准正态:

Xˉnμσ/ndN(0,1),n\frac{\bar{X}_n - \mu}{\sigma / \sqrt{n}} \xrightarrow{d} N(0, 1), \quad n \to \infty

Lindeberg-Feller 定理进一步将条件推广至独立但非同分布的情形,而 Berry-Esseen 不等式提供了收敛速度的量化界。中心极限定理解释了为何正态分布在自然界中如此普遍:任何由大量独立微小因素叠加而成的随机变量——测量误差、生物性状、资产收益率在理想化假设下——都近似服从正态分布。

计量经济学中的应用

正态分布在计量经济学中扮演着不可替代的角色:

  • 经典线性回归Gauss-Markov 定理确保 OLS 估计量在无正态假设下也是 BLUE;但若要构造精确的 t 检验和 F 检验,则需假设误差项服从正态分布。在小样本中,uN(0,σ2I)u \sim N(0, \sigma^2 I) 使得 β^N(β,σ2(XX)1)\hat{\beta} \sim N(\beta, \sigma^2 (X'X)^{-1}) 严格成立。
  • 最大似然估计:正态分布是所有具有给定均值和方差的分布中熵最大的分布(最大熵原理),这一性质使其在信息论和贝叶斯统计中具有独特地位。
  • Jarque-Bera 检验:基于样本偏度和峰度构造检验统计量 JB=n6[S2+(K3)24]JB = \frac{n}{6}\left[S^2 + \frac{(K-3)^2}{4}\right],在正态零假设下渐近服从 χ2(2)\chi^2(2),是检验正态性的常用工具。
  • 对数正态分布:若 logYN(μ,σ2)\log Y \sim N(\mu, \sigma^2),则 YY 服从对数正态分布,广泛用于建模工资、收入、股票价格等非负且右偏的经济变量。

与其他分布的关系

正态分布衍生出一个庞大的分布族:

  • 卡方分布:若 Z1,,ZνZ_1, \ldots, Z_{\nu} 独立同分布于 N(0,1)N(0, 1),则 i=1νZi2χ2(ν)\sum_{i=1}^{\nu} Z_i^2 \sim \chi^2(\nu)卡方分布是有限样本下推断线性约束是否成立的基石。
  • t 分布:若 ZN(0,1)Z \sim N(0,1)Vχ2(ν)V \sim \chi^2(\nu) 独立,则 T=Z/V/νt(ν)T = Z / \sqrt{V/\nu} \sim t(\nu)。当 ν\nu \to \infty 时,t 分布趋近于标准正态。
  • F 分布:两个独立卡方变量之比经自由度调整后服从 F 分布,用于检验多个线性约束和整体显著性。

正态分布从 de Moivre 对二项分布的渐近逼近起步,历经高斯的天文误差建模和拉普拉斯的理论奠基,到20世纪在 Fisher、Neyman 和 Pearson 的推断体系中成为默认假设,其重要性非其他任何概率分布可比。尽管厚尾分布(如 t 分布、帕累托分布)在金融和极端事件建模中揭示了正态假设的局限,正态分布在统计推断中的理论地位和在中等样本下的经验适用性仍然不可动摇。