ARTICLE

发生比

发生比 (Odds) 发生比(Odds)是概率论和统计学中衡量事件发生可能性的替代尺度,定义为事件发生概率与不发生概率的比值: 其中 p = P(Y=1) 为事件发生的概率。概率取值 [0,1],而发生比将其"拉伸"至 [0, )——这一消除上限的变换是众多统计建模技术的数学基础。 发生比与概率的互转 概率与发生比可双向换算: 当发生比 =1 时 p=0.5

浏览 0 更新 2025-10-26

发生比 (Odds)

发生比(Odds)是概率论统计学中衡量事件发生可能性的替代尺度,定义为事件发生概率与不发生概率的比值:

Odds=p1p\text{Odds} = \frac{p}{1-p}

其中 p=P(Y=1)p = P(Y=1) 为事件发生的概率。概率取值 [0,1][0,1],而发生比将其"拉伸"至 [0,)[0, \infty)——这一消除上限的变换是众多统计建模技术的数学基础。

发生比与概率的互转

概率与发生比可双向换算:

p=Odds1+Odds,Odds=p1pp = \frac{\text{Odds}}{1 + \text{Odds}}, \quad \text{Odds} = \frac{p}{1-p}

当发生比 =1=1p=0.5p=0.5(等可能);发生比 =3=3p=0.75p=0.75;发生比 =1/3=1/3p=0.25p=0.25。发生比 >1>1 意味事件更可能发生,<1<1 则相反。例如,若某疾病年发病率 p=0.2p=0.2,则发生比为 0.2/0.8=0.250.2/0.8=0.25——"每发生一例对应四例未发生";若另一地区 p=0.4p=0.4,发生比为 0.4/0.60.6670.4/0.6\approx 0.667,后者发生比是前者的 2.672.67 倍。在罕见事件(p0.1p \ll 0.1)场合,分母 1p11-p \approx 1,发生比近似等于概率本身,两者差异可忽略。

对数发生比 (Logit)

对发生比取自然对数得到对数发生比(log-odds,也称 logit 变换):

logit(p)=ln(p1p)\text{logit}(p) = \ln\left(\frac{p}{1-p}\right)

该变换将概率的 [0,1][0,1] 映射到整个实数线 (,+)(-\infty, +\infty),彻底消除了上下界约束,使线性模型可直接作用于变换后的量。在Logit 模型(逻辑回归)中,因变量正是对数发生比:

ln(pi1pi)=β0+β1X1i++βkXki\ln\left(\frac{p_i}{1-p_i}\right) = \beta_0 + \beta_1 X_{1i} + \cdots + \beta_k X_{ki}

发生比之比 (Odds Ratio)

发生比之比(OR)是流行病学和医学统计中的核心效应量指标,定义为两组发生比的比值:

OR=p1/(1p1)p0/(1p0)\text{OR} = \frac{p_1 / (1-p_1)}{p_0 / (1-p_0)}

Logistic 回归框架下,系数取指数即得发生比之比:eβke^{\beta_k} 表示 XkX_k 每增加一个单位,发生比被乘以 eβke^{\beta_k}。OR =1=1 表示无效应;OR >1>1 为风险因子;OR <1<1 为保护因子。在病例对照研究中,由于抽样基于结局而非暴露,无法直接估计相对风险(RR),但可通过 OR 近似 RR(当疾病罕见时近似良好)。

相对于概率的优势

发生比在多个统计领域中优于原始概率:(1)乘法结构天然适合指数族分布和贝叶斯更新;(2)logit 将模型线性化,避免了概率在 [0,1][0,1] 边界处的非线性约束;(3)OR 的对称性——若事件发生比为 oo,不发生比为 1/o1/o——使方向的逆转在数学上简洁对称。这些性质使发生比成为信用评分(违约发生比)、政治学投票模型、流行病学博彩赔率等应用的标准语言。