ARTICLE

Odds

Odds(赔率/优势比)是概率论与统计学中衡量事件发生可能性的一种表达方式,定义为事件发生的概率与事件不发生的概率之比。与概率(probability)不同,odds并非以0到1的标度表示,而是以0到正无穷的范围展开:当odds等于1时,事件发生与不发生的可能性相等;odds大于1表示事件更可能发生;odds小于1则表示事件更不可能发生。这一概念在博彩业、流

浏览 0 更新 2025-11-08

Odds(赔率/优势比)是概率论与统计学中衡量事件发生可能性的一种表达方式,定义为事件发生的概率与事件不发生的概率之比。与概率(probability)不同,odds并非以0到1的标度表示,而是以0到正无穷的范围展开:当odds等于1时,事件发生与不发生的可能性相等;odds大于1表示事件更可能发生;odds小于1则表示事件更不可能发生。这一概念在博彩业、流行病学、逻辑回归和决策理论中有着广泛而深入的应用。

1. 数学定义与基本性质

1.1 定义

设某事件 AA 发生的概率为 pp,则事件 AAodds 定义为:

odds(A)=p1p\text{odds}(A) = \frac{p}{1-p}

其中 0<p<10 < p < 1。当 p=0p=0 时,odds = 0;当 p=1p=1 时,odds 趋于无穷大。由此可见,odds的取值范围为 [0,)[0, \infty)

反过来,若已知odds值 oo,可恢复出对应的概率:

p=o1+op = \frac{o}{1+o}

这一变换表明,odds和概率之间存在一一对应的双射关系。例如,当odds = 2时,p=2/30.667p = 2/3 \approx 0.667;当odds = 0.25时,p=0.25/1.25=0.20p = 0.25/1.25 = 0.20

1.2 对数优势

在实际统计建模中,更常用的变体是 对数优势(log-odds),即对odds取自然对数:

logit(p)=ln(p1p)\text{logit}(p) = \ln\left(\frac{p}{1-p}\right)

logit函数将概率从 (0,1)(0,1) 映射到整个实数轴 (,)(-\infty, \infty),这一特性使其成为广义线性模型中连接函数的理想选择。logit函数的反函数为逻辑斯蒂函数(logistic function),二者共同构成了逻辑回归模型的理论基石。

2. Odds在博彩业中的应用

2.1 博彩赔率的三种形式

在博彩行业中,odds以三种主要形式呈现:小数赔率(Decimal Odds,流行于欧洲、澳大利亚和加拿大)、分数赔率(Fractional Odds,流行于英国和爱尔兰)和 美式赔率(American Odds/Moneyline Odds,流行于美国)。

小数赔率以数字形式直接表示一单位赌注的总返还额。例如,赔率为2.50意味着投注1元,若获胜则总计返还2.50元(包含本金),净收益为1.50元。小数赔率与概率的关系为:p=1/小数赔率p = 1/\text{小数赔率}

分数赔率以分数形式表示净收益与赌注之比。例如,赔率为5/1(读作"五对一"),表示每投注1元可获得5元净收益,总返还为6元。分数赔率 a/ba/b 对应的小数赔率为 1+a/b1 + a/b。隐含概率为 b/(a+b)b/(a+b)

美式赔率以正负数表示。正数(如+200)表示投注100元可获得的净收益(200元);负数(如-150)表示要获得100元净收益所需投注的金额(150元)。正美式赔率与小数赔率的关系为:小数赔率 = 1 + 美式赔率/100;负美式赔率的关系为:小数赔率 = 1 + 100/|美式赔率|。

2.2 隐含概率与庄家优势

赔率中蕴含的隐含概率之和通常超过100\%,超出部分即为庄家优势(House Edge)或抽水(Vigorish)。例如,若庄家对某场比赛开出A队赔率1.80(隐含概率55.56\%)和B队赔率2.00(隐含概率50.00\%),隐含概率之和为105.56\%,超出5.56个百分点即为庄家的理论收益。这意味着长期参与博弈的玩家必然面临期望值为负的局面。

3. 流行病学中的优势比

3.1 定义与解释

优势比(Odds Ratio,OR)是流行病学和医学研究中衡量暴露因素与疾病之间关联强度的核心指标。在病例对照研究中,优势比定义为暴露组中事件发生的odds与非暴露组中事件发生的odds之比:

OR=暴露组的odds非暴露组的odds=p1/(1p1)p2/(1p2)\text{OR} = \frac{\text{暴露组的odds}}{\text{非暴露组的odds}} = \frac{p_1/(1-p_1)}{p_2/(1-p_2)}

式中 p1p_1 暴露组的事件发生率,p2p_2 为非暴露组的事件发生率。OR = 1表示暴露与事件无关;OR > 1表示暴露增加了事件发生的odds(风险因素);OR < 1表示暴露降低了事件发生的odds(保护因素)。

3.2 与相对风险的区别

优势比与相对风险(Relative Risk,RR)在数值上存在重要差异。相对风险定义为 RR=p1/p2RR = p_1/p_2。当事件发生率较低(罕见病假设,即 p<0.1p < 0.1)时,OR近似等于RR;但当事件发生率较高时,OR会显著偏离RR并夸大效应大小。例如,若暴露组发病率为60\%,非暴露组为30\%,则OR = (0.6/0.4)/(0.3/0.7) = 3.5,而RR = 0.6/0.3 = 2.0。因此在队列研究中,研究者更倾向于报告RR而非OR,而病例对照研究因无法直接计算发病率而通常使用OR。

3.3 逻辑回归中的系数解释

在逻辑回归模型中,回归系数的指数化结果恰好是优势比。具体地,对于模型:

ln(p1p)=β0+β1x1++βkxk\ln\left(\frac{p}{1-p}\right) = \beta_0 + \beta_1 x_1 + \cdots + \beta_k x_k

自变量 xjx_j 每增加一个单位,事件的odds乘以 eβje^{\beta_j}。这一特性使逻辑回归系数的解释具有天然的直观性:eβje^{\beta_j} 表示控制其他变量不变时,xjx_j 每增加一个单位所对应的odds变化倍数。

4. 决策理论与博弈中的Odds

在决策理论中,odds常与先验概率后验概率的更新联系在一起。贝叶斯因子(Bayes Factor)本质上就是两个假设的后验odds相对于先验odds的比率。若先验odds为 Oprior=P(H1)/P(H0)O_{\text{prior}} = P(H_1)/P(H_0),后验odds为 Oposterior=P(H1D)/P(H0D)O_{\text{posterior}} = P(H_1|D)/P(H_0|D),则贝叶斯因子 K=Oposterior/OpriorK = O_{\text{posterior}} / O_{\text{prior}},它衡量了数据对两个假设相对支持程度的倍数变化。

在博弈论中,公平赔率(Fair Odds)是指使博弈的期望收益为零的赔率。如果一个人认为某事件发生的概率为 pp,那么对他而言公平的小数赔率应为 1/p1/p。当实际赔率高于公平赔率时,该赌注具有正的期望收益(+EV),这是专业博彩玩家和量化交易者持续寻找的机会。

5. Odds的局限性

尽管odds在许多领域中有广泛应用,但亦存在明显的局限性。其一,odds的值域为 [0,)[0, \infty),缺乏概率的直观性,普通受众更容易理解"有70\%的几率"而非"odds约为2.33"。其二,当事件发生率极低或极高时,odds的数值变化剧烈,不利于直观比较。其三,优势比(OR)在与相对风险混淆使用时可能造成误导性夸大效应,这在医学文献中已引发广泛关注和讨论。

此外,在零事件或全事件的情况下(p=0p=0p=1p=1),odds退化为0或无穷大,无法直接使用。实际应用中常通过添加伪计数(如Haldane-Anscombe校正)来解决这一问题。

6. 总结

Odds作为概率的另一种度量方式,其独特的比数结构在博彩赔率体系、流行病学中的病例对照研究、逻辑回归的参数解释以及贝叶斯统计中的假设检验等领域发挥着不可替代的作用。理解odds与概率之间的转换关系、对数优势的数学便利性以及优势比与相对风险的区别,对于正确解读众多定量研究结果和参与概率性决策至关重要。随着数据科学和机器学习方法的普及,odds这一经典概念将在预测建模和风险评估中持续焕发新的生命力。