ARTICLE

连续均匀分布

连续均匀分布 连续均匀分布=概率论中最基本的连续概率分布→随机变量在有限区间[a,b]内任意等长子区间取值的概率相等→描述"完全无知"或"等可能"的先验信念→是贝叶斯统计中无信息先验的重要选择→也是蒙特卡洛方法中生成一切随机变量的起点。记为 X U(a,b) 或 X Uniform(a,b)。 定义与密度函数 若连续随机变量X取值于区间[a,b](a<b),

浏览 5 更新 2025-10-26

连续均匀分布

连续均匀分布=概率论中最基本的连续概率分布→随机变量在有限区间[a,b][a,b]内任意等长子区间取值的概率相等→描述"完全无知"或"等可能"的先验信念→是贝叶斯统计中无信息先验的重要选择→也是蒙特卡洛方法中生成一切随机变量的起点。记为 XU(a,b)X\sim U(a,b)XUniform(a,b)X\sim\text{Uniform}(a,b)

定义与密度函数

若连续随机变量XX取值于区间[a,b][a,b]a<ba<b),其概率密度函数PDF为:

f(x;a,b)=\begin{cases} \frac{1}{b-a}, & a\leq x\leq b\\

0, \& 其他\text{其他}

\end{cases}

密度在支撑集上恒为常数1ba\frac{1}{b-a}→图形为[a,b][a,b]上的水平线段+两端零→是连续分布中最简单的密度形式。参数aa=下界(位置参数),bb=上界,区间长度bab-a决定密度高度→区间越长密度越低以保证总积分为1。支撑集紧致→保证了一切矩均有限存在→与正态分布等无界支撑分布形成对比。

参数约束:必须a<ba<b→若a=ba=b则退化为退化分布(单点分布)→无密度。实际应用中常标准化至U(0,1)U(0,1)以简化分析。

累积分布函数CDF

F(x)=P(X\leq x)=\begin{cases}

0, \& x<a\\

\frac{x-a}{b-a}, & a\leq x<b\\

1, \& x\geq b

\end{cases}

CDF在[a,b][a,b]内线性增长→斜率=1ba\frac{1}{b-a}→直观反映"等可能":设子区间[c,d][a,b][c,d]\subset[a,b]P(cXd)=dcbaP(c\leq X\leq d)=\frac{d-c}{b-a}→概率仅取决于区间长度→与位置无关。此性质可作另一定义:若某连续分布的CDF在支撑集上为线性函数→则该分布必为均匀分布。

数字特征

  • 期望/均值E[X]=a+b2E[X]=\frac{a+b}{2}——区间中点→对称性自然结果→是位置参数的直接体现。
  • 中位数=a+b2=\frac{a+b}{2}——与均值重合→因为分布关于中心完全对称。
  • 方差Var(X)=(ba)212\text{Var}(X)=\frac{(b-a)^2}{12}——仅取决于区间长度平方→区间越宽→不确定性越大。推导:先求二阶原点矩E[X2]=abx21badx=a2+ab+b23E[X^2]=\int_a^b x^2\frac{1}{b-a}dx=\frac{a^2+ab+b^2}{3}→再Var=E[X2](E[X])2=(ba)212\text{Var}=E[X^2]-(E[X])^2=\frac{(b-a)^2}{12}。标准差σ=ba23\sigma=\frac{b-a}{2\sqrt{3}}约为区间长度的0.289倍。
  • 矩母函数MGFMX(t)=etbetat(ba)M_X(t)=\frac{e^{tb}-e^{ta}}{t(b-a)}t0t\neq0),MX(0)=1M_X(0)=1→通过极限t0t\to0时洛必达法则验证。
  • 特征函数φX(t)=eitbeitait(ba)\varphi_X(t)=\frac{e^{itb}-e^{ita}}{it(b-a)}→在证明中心极限定理相关命题时常用。
  • :微分熵=ln(ba)\ln(b-a)→在所有支撑集为[a,b][a,b]的连续分布中,均匀分布的熵最大→即"最少信息/最大不确定性"→是最大熵原理的自然先验→当仅知变量范围而不知其他任何信息时→均匀分布是唯一合理的选择。
  • 偏度:0——完全对称→无偏斜。峰度95=1.8\frac{9}{5}=1.8——低于正态分布的3→均匀分布的尾部比正态更"薄"→极端值不可能超出[a,b][a,b]

与其他分布的关系

①概率积分变换:若XU(0,1)X\sim U(0,1)→对任意连续分布FYF_Y(严格增)→Y=FY1(X)FYY=F_Y^{-1}(X)\sim F_Y→均匀分布是生成一切连续分布的"原子分布"→逆变换采样的基础→蒙特卡洛模拟核心工具→无论目标分布多复杂→只要CDF可逆→即可从U(0,1)U(0,1)采样。

②与Beta分布U(0,1)=Beta(1,1)U(0,1)=\text{Beta}(1,1)→Beta分布在α=β=1\alpha=\beta=1时退化为均匀分布→Beta族可视为均匀分布的灵活推广→通过调整α,β\alpha,\beta可拟合U形、钟形、J形等多种形状。

③与指数分布:若XU(0,1)X\sim U(0,1)Y=λlnXExp(λ)Y=-\lambda\ln X\sim\text{Exp}(\lambda)→此即指数分布的逆变换采样公式→广泛用于排队论与可靠性工程模拟。

④顺序统计量nn个独立U(0,1)U(0,1)的第kk顺序统计量→X(k)Beta(k,nk+1)X_{(k)}\sim\text{Beta}(k,n-k+1)→此性质在非参数统计排序检验中关键→如Kolmogorov-Smirnov检验的零分布即基于均匀顺序统计量。

⑤与正态分布Box-Muller变换→两独立U(0,1)U(0,1)Z1=2lnU1cos(2πU2)Z_1=\sqrt{-2\ln U_1}\cos(2\pi U_2),Z2=2lnU1sin(2πU2)Z_2=\sqrt{-2\ln U_1}\sin(2\pi U_2)→独立标准正态→是正态随机数生成的经典方法。

⑥与柯西分布:若XU(π/2,π/2)X\sim U(-\pi/2,\pi/2)Y=tanXCauchy(0,1)Y=\tan X\sim\text{Cauchy}(0,1)

经济与统计应用

随机化实验随机对照试验RCT中→处理分配常取U(0,1)U(0,1)→若uipu_i\leq p则入处理组→保证无混杂偏倚→是因果推断潜在结果框架的基础操作。

蒙特卡洛积分abg(x)dxbani=1ng(Xi)\int_a^b g(x)dx\approx\frac{b-a}{n}\sum_{i=1}^n g(X_i),XiiidU(a,b)X_i\overset{iid}{\sim}U(a,b)大数定律保证nn\to\infty时收敛→收敛速率O(1/n)O(1/\sqrt{n})与维度无关→是数值积分贝叶斯计算(MCMC)的基石。

拍卖与博弈第一价格密封拍卖中→竞标者私有估值常设viU[0,1]v_i\sim U[0,1]→对称均衡出价策略b(v)=n1nvb(v)=\frac{n-1}{n}v→竞标者按比例压低报价→随竞标者数nn增加→报价趋近真实估值→是拍卖理论的标准入门模型。

稳健性检验:敏感性分析中→对不确定参数设均匀先验(最大熵理由)→考察结论在参数范围内的稳定性→若结论对均匀先验不敏感→则对其他先验也大概率稳健。

随机效用模型Logit模型中→随机效用ϵij\epsilon_{ij}若设均匀而非极值分布→得线性概率模型LPM→虽不如Logit常用→但直观阐明离散选择中"效用最大化→选择概率"的基本逻辑→且LPM在边际效应估计上有独特优势。

接受-拒绝采样:当目标分布的CDF不可逆时→用均匀分布作为提议分布→结合接受概率筛选样本→是通用随机数生成框架→MCMCMetropolis-Hastings算法的思想前身。

连续均匀与离散均匀:两者共享"等可能"核心思想→但连续均匀的P(X=x)=0P(X=x)=0对任意单点→而离散均匀P(X=xi)=1/nP(X=x_i)=1/n→本质区别在于测度→连续用Lebesgue测度→离散用计数测度→该对偶关系贯穿概率论全部理论。

参数估计

给定独立同分布样本X1,,XnU(a,b)X_1,\dots,X_n\sim U(a,b)a,ba,b未知)→矩估计:令Xˉ=a^+b^2\bar{X}=\frac{\hat{a}+\hat{b}}{2},S2=(b^a^)212S^2=\frac{(\hat{b}-\hat{a})^2}{12}→解得a^=Xˉ3S\hat{a}=\bar{X}-\sqrt{3}S,b^=Xˉ+3S\hat{b}=\bar{X}+\sqrt{3}S→简单但不保证a^minXi\hat{a}\leq\min X_ib^maxXi\hat{b}\geq\max X_i

极大似然估计MLE:似然函数L(a,b)=i=1n1ba1[aXib]=1(ba)n1[aX(1),X(n)b]L(a,b)=\prod_{i=1}^n\frac{1}{b-a}\cdot\mathbf{1}_{[a\leq X_i\leq b]}=\frac{1}{(b-a)^n}\cdot\mathbf{1}_{[a\leq X_{(1)},X_{(n)}\leq b]}→其中X(1)=minXiX_{(1)}=\min X_i,X(n)=maxXiX_{(n)}=\max X_i顺序统计量。似然随bab-a减小而增大→故应使区间尽可能窄但仍覆盖所有样本→MLE为a^MLE=X(1)\hat{a}_{MLE}=X_{(1)},b^MLE=X(n)\hat{b}_{MLE}=X_{(n)}。MLE有偏但一致a^MLE\hat{a}_{MLE}低估aab^MLE\hat{b}_{MLE}高估bb→因为样本极值倾向于落在真实边界之内。均匀分布的MLE不满足正则条件(支撑集依赖参数)→Fisher信息矩阵标准理论不直接适用→渐近分布非正态而是极值分布→是统计推断中重要的反例。

标准均匀分布

特例U(0,1)U(0,1)→PDF=1(0x10\leq x\leq1)→CDF=xx(恒等函数)→均值12\frac12→方差112\frac1{12}→是最常用的基准分布。任何XU(a,b)X\sim U(a,b)可经线性变换Z=XabaU(0,1)Z=\frac{X-a}{b-a}\sim U(0,1)标准化→标准化均匀是连续分布族的"原点"→类似标准正态N(0,1)N(0,1)在正态族中的地位→几乎所有统计软件的随机数生成器都以U(0,1)U(0,1)为底层引擎→再通过变换产生各类分布→这一事实凸显了均匀分布在计算统计中的枢纽地位。