发生比 (Odds)
发生比(Odds)是概率论和统计学中衡量事件发生可能性的替代尺度,定义为事件发生概率与不发生概率的比值:
Odds=1−pp
其中 p=P(Y=1) 为事件发生的概率。概率取值 [0,1],而发生比将其"拉伸"至 [0,∞)——这一消除上限的变换是众多统计建模技术的数学基础。
发生比与概率的互转
概率与发生比可双向换算:
p=1+OddsOdds,Odds=1−pp
当发生比 =1 时 p=0.5(等可能);发生比 =3 时 p=0.75;发生比 =1/3 时 p=0.25。发生比 >1 意味事件更可能发生,<1 则相反。例如,若某疾病年发病率 p=0.2,则发生比为 0.2/0.8=0.25——"每发生一例对应四例未发生";若另一地区 p=0.4,发生比为 0.4/0.6≈0.667,后者发生比是前者的 2.67 倍。在罕见事件(p≪0.1)场合,分母 1−p≈1,发生比近似等于概率本身,两者差异可忽略。
对数发生比 (Logit)
对发生比取自然对数得到对数发生比(log-odds,也称 logit 变换):
logit(p)=ln(1−pp)
该变换将概率的 [0,1] 映射到整个实数线 (−∞,+∞),彻底消除了上下界约束,使线性模型可直接作用于变换后的量。在Logit 模型(逻辑回归)中,因变量正是对数发生比:
ln(1−pipi)=β0+β1X1i+⋯+βkXki
发生比之比 (Odds Ratio)
发生比之比(OR)是流行病学和医学统计中的核心效应量指标,定义为两组发生比的比值:
OR=p0/(1−p0)p1/(1−p1)
在Logistic 回归框架下,系数取指数即得发生比之比:eβk 表示 Xk 每增加一个单位,发生比被乘以 eβk。OR =1 表示无效应;OR >1 为风险因子;OR <1 为保护因子。在病例对照研究中,由于抽样基于结局而非暴露,无法直接估计相对风险(RR),但可通过 OR 近似 RR(当疾病罕见时近似良好)。
相对于概率的优势
发生比在多个统计领域中优于原始概率:(1)乘法结构天然适合指数族分布和贝叶斯更新;(2)logit 将模型线性化,避免了概率在 [0,1] 边界处的非线性约束;(3)OR 的对称性——若事件发生比为 o,不发生比为 1/o——使方向的逆转在数学上简洁对称。这些性质使发生比成为信用评分(违约发生比)、政治学投票模型、流行病学和博彩赔率等应用的标准语言。