ARTICLE

标准正态分布

标准正态分布 (Standard Normal Distribution) 标准正态分布 (Standard Normal Distribution),亦称 Z分布,是概率论和统计学中最基础也最重要的连续概率分布之一。它是正态分布家族中的一个特例,其均值恰好为 0,标准差恰好为 1。任何一个服从一般正态分布的随机变量均可通过标准化变换转化为标准正态分布,这一

浏览 62 更新 2025-10-27

标准正态分布 (Standard Normal Distribution)

标准正态分布 (Standard Normal Distribution),亦称 Z分布,是概率论统计学中最基础也最重要的连续概率分布之一。它是正态分布家族中的一个特例,其均值恰好为 0,标准差恰好为 1。任何一个服从一般正态分布的随机变量均可通过标准化变换转化为标准正态分布,这一性质使得概率计算和统计推断工作大为简化,标准正态分布也因此成为假设检验置信区间等理论的基石。

数学定义

标准正态随机变量通常记作 Z Z ,其概率密度函数 (PDF) 为:

ϕ(z)=12πe12z2,zR\phi(z) = \frac{1}{\sqrt{2\pi}} e^{-\frac{1}{2}z^2}, \quad z \in \mathbb{R}

其中 e e 欧拉数π \pi 是圆周率。该函数描述了著名的"钟形曲线",在 z=0 z=0 处取最大值,向两侧对称衰减。函数值 ϕ(z) \phi(z) 本身并非概率,其曲线下面积才对应概率。

累积分布函数 (CDF) 定义为:

Φ(z)=P(Zz)=z12πe12t2dt\Phi(z) = P(Z \le z) = \int_{-\infty}^{z} \frac{1}{\sqrt{2\pi}} e^{-\frac{1}{2}t^2} \, dt

该积分无初等函数解析解,需查阅 Z-table 或借助统计软件计算。例如 Φ(0)=0.5 \Phi(0) = 0.5 ,表示 Z Z 小于等于 0 的概率为 50\%。

主要性质

  1. 对称性:曲线关于 z=0 z=0 对称,ϕ(z)=ϕ(z) \phi(z) = \phi(-z) ,且 Φ(z)=1Φ(z) \Phi(-z) = 1 - \Phi(z)
  2. 集中趋势:均值、中位数众数均在 0 处重合。
  3. 离散程度:标准差为 1,方差为 1。
  4. 峰度与偏度偏度为 0(对称分布),峰度为 3,超额峰度为 0,是衡量其他分布峰度的基准。
  5. 经验法则 (68-95-99.7):约 68\% 的值落在 [1,1] [-1, 1] ,约 95\% 落在 [2,2] [-2, 2] ,约 99.7\% 落在 [3,3] [-3, 3] 区间内。

标准化与 Z-score

对任意一般正态变量 XN(μ,σ2) X \sim N(\mu, \sigma^2) ,标准化公式为:

Z=XμσZ = \frac{X - \mu}{\sigma}

所得 Z Z 值称为 Z-score(标准分数),度量原始观测值 X X 偏离均值 μ \mu 的标准差倍数。

示例:设某地男性身高 XN(175,52) X \sim N(175, 5^2) ,求身高超过 185cm 的概率。先标准化:Z=(185175)/5=2 Z = (185-175)/5 = 2 ,则 P(X>185)=P(Z>2)=1Φ(2) P(X > 185) = P(Z > 2) = 1 - \Phi(2) 。查表得 Φ(2)0.9772 \Phi(2) \approx 0.9772 ,故概率约为 0.0228,即约 2.28\% 的男性身高超过 185cm。此例展示了标准化将任意正态分布问题转化为标准正态分布求解的通用方法。

在统计推断中的作用

标准正态分布是统计推断的理论核心。中心极限定理表明,大量独立同分布随机变量的样本均值经适当标准化后趋近于标准正态分布,这奠定了大样本推断的基础。在假设检验(如 Z 检验)中,检验统计量在零假设下服从标准正态分布,通过计算P值与临界值比较来判断是否拒绝零假设。在构建置信区间时,常用临界值 Z.025=1.96 Z_{.025} = 1.96 Z.005=2.576 Z_{.005} = 2.576 均来自标准正态分布的分位数。标准化使得仅需一张标准正态分布表即可解决所有正态分布相关的概率计算,极大提升了统计分析的效率。