知经 KNOWECON · 卓越的经济金融统计数学学习平台

鹰鸽博弈_(Hawk-Dove_Game)

# 鹰鸽博弈 (Hawk-Dove Game)

鹰鸽博弈 (Hawk-Dove Game),有时也被称为 懦夫博弈 (Chicken Game) 或 边缘策略博弈 (Brinkmanship),是{{{博弈论}}}中一个重要的对称博弈模型。它主要用来分析两个参与者在争夺一项资源时,选择对抗性策略(鹰派)或非对抗性策略(鸽派)的冲突过程。此模型最初由[[约翰·梅纳德·史密斯]]和[[乔治·普莱斯]]在1973年应用于{{{演化生物学}}},用以解释动物间冲突的行为模式,但其应用已广泛扩展到{{{经济学}}}、{{{国际关系}}}和{{{社会学}}}等领域。

鹰鸽博弈的核心在于,每个参与者都希望获得资源,但又不希望为此付出惨重的斗争代价。这导致了一种独特的策略困境:表现出攻击性可能会吓退对手,从而独占资源;但如果对手也同样具有攻击性,双方将陷入代价高昂的冲突,结果可能比放弃资源更糟。

## 博弈的设定与支付矩阵 (Game Setup and Payoff Matrix)

在一个标准的鹰鸽博弈中,我们假设有两个参与者(例如两只动物)在争夺一项有价值的资源。

* 资源的价值记为 $V$ (Value)。 * 如果双方发生激烈冲突,所付出的代价(如受伤)记为 $C$ (Cost)。

一个关键的假设是 $C > V > 0$ ,即冲突的代价大于资源的价值。这意味着虽然资源是值得争取的,但两败俱伤的结局是所有结果中最差的。

每个参与者有两种策略可供选择: 1. 鹰派 (Hawk): 采取侵略性策略。如果对手也是鹰派,则双方将进行激烈斗争;如果对手是鸽派,则鹰派将不战而胜,独占资源。 2. 鸽派 (Dove): 采取非侵略性策略。如果对手是鹰派,鸽派会立即退让,避免冲突;如果对手也是鸽派,则双方将平分资源。

根据这些规则,我们可以构建如下的{{{支付矩阵}}} (Payoff Matrix),其中每个单元格的第一个数字代表参与者1的收益,第二个数字代表参与者2的收益。

| | 参与者2: 鹰派 (Hawk) | 参与者2: 鸽派 (Dove) | | :--------- | :--------------------- | :--------------------- | | 参与者1: 鹰派 (Hawk) | $(\frac{V-C}{2}, \frac{V-C}{2})$ | $(V, 0)$ | | 参与者1: 鸽派 (Dove) | $(0, V)$ | $(\frac{V}{2}, \frac{V}{2})$ |

支付解读: * (鹰, 鹰): 双方都选择战斗。他们各有50%的概率赢得资源 $V$,但都必须付出代价 $C$。因此,每个人的期望收益是 $0.5 \times V - C$,在更通用的形式下,假设双方平分资源但都受伤,收益为 $(\frac{V}{2} - C)$。由于我们假设 $C > V$,这个收益是负数,是双方的最差结果。 * (鹰, 鸽): 鹰派参与者获得全部资源 $V$,因为它没有遇到抵抗。鸽派参与者退让,收益为0,但避免了冲突的代价 $C$。 * (鸽, 鹰): 与上一情况对称,参与者1(鸽)收益为0,参与者2(鹰)收益为 $V$。 * (鸽, 鸽): 双方都避免了冲突,和平地平分了资源。每方的收益均为 $\frac{V}{2}$。

## 纳什均衡分析 (Nash Equilibrium Analysis)

{{{纳什均衡}}} (Nash Equilibrium) 是指在博弈中,任何一方都无法通过单方面改变其策略来获得更高收益的一种策略组合。

### 纯策略纳什均衡 (Pure Strategy Nash Equilibrium)

我们可以通过检查支付矩阵来寻找{{{纯策略}}}纳什均衡:

1. 从 (鹰, 鹰) 开始:参与者1的收益是 $\frac{V-C}{2}$。如果他单方面改变策略为“鸽”,他的收益将变为0。因为 $C > V$,所以 $\frac{V-C}{2} < 0$,因此从负收益变为0是一种改进。所以,参与者1有动机改变策略。(鹰, 鹰) 不是纳什均衡。

2. 从 (鸽, 鸽) 开始:参与者1的收益是 $\frac{V}{2}$。如果他单方面改变策略为“鹰”,他的收益将变为 $V$。因为 $V > \frac{V}{2}$,参与者1有动机改变策略。(鸽, 鸽) 不是纳什均衡。这个结果揭示了合作(双方都当鸽派)的不稳定性,因为总有一方有背叛并采取侵略性策略的冲动。

3. 从 (鹰, 鸽) 开始: * 参与者1 (鹰) 的收益是 $V$。如果他改为“鸽”,收益将变为 $\frac{V}{2}$。他没有动机改变。 * 参与者2 (鸽) 的收益是 0。如果他改为“鹰”,收益将变为 $\frac{V-C}{2}$(负值)。他也没有动机改变。 * 因此,(鹰, 鸽) 是一个纯策略纳什均衡

4. 从 (鸽, 鹰) 开始:通过对称性分析,同理可知,(鸽, 鹰) 也是一个纯策略纳什均衡

结论是,鹰鸽博弈有两个纯策略纳什均衡:(鹰, 鸽) 和 (鸽, 鹰)。这两个均衡都是非对称的,即一个参与者扮演侵略者,另一个扮演退让者。博弈的挑战在于,双方都想成为那个“鹰”,但都害怕最终落入 (鹰, 鹰) 的灾难性结局。

### 混合策略纳什均衡 (Mixed Strategy Nash Equilibrium)

除了纯策略,还存在一个{{{混合策略}}}纳什均衡。在混合策略中,参与者以一定的概率随机选择“鹰”或“鸽”。

要找到这个均衡,我们需要找到一个概率组合,使得每个参与者选择“鹰”或“鸽”的{{{期望收益}}} (Expected Payoff) 相等。这样,参与者对于选择任何一种策略都无所谓。

假设参与者2以概率 $p$ 选择“鹰”,以概率 $(1-p)$ 选择“鸽”。我们来计算参与者1选择不同策略时的期望收益: * $E_1(\text{鹰}) = p \cdot (\frac{V-C}{2}) + (1-p) \cdot V$ * $E_1(\text{鸽}) = p \cdot 0 + (1-p) \cdot \frac{V}{2}$

为了使参与者1无差别选择,我们令 $E_1(\text{鹰}) = E_1(\text{鸽})$: $$ p \left(\frac{V-C}{2}\right) + V - pV = (1-p) \frac{V}{2} $$ $$ \frac{pV}{2} - \frac{pC}{2} + V - pV = \frac{V}{2} - \frac{pV}{2} $$ $$ V - \frac{pC}{2} = \frac{V}{2} $$ $$ \frac{V}{2} = \frac{pC}{2} $$ $$ p = \frac{V}{C} $$

由于博弈是对称的,同样的逻辑适用于参与者2。因此,混合策略纳什均衡是:每个参与者都以 $p = \frac{V}{C}$ 的概率选择“鹰”,以 $1 - \frac{V}{C}$ 的概率选择“鸽”

这个混合策略均衡的存在性和稳定性取决于 $V < C$。由于 $p$ 是一个概率,它必须在 $[0, 1]$ 区间内,而 $V < C$ 保证了 $p < 1$。

## 演化稳定策略 (Evolutionarily Stable Strategy - ESS)

在演化博弈论的语境下,我们关心的是哪种策略在种群中能够抵抗“突变”策略的入侵,即{{{演化稳定策略}}} (ESS)。

* 纯策略“鸽”不是ESS:在一个全是鸽派的种群中,一个鹰派突变体将会获得极大的成功(每次都得到 $V$),其基因会迅速扩散。 * 纯策略“鹰”不是ESS (在 $C>V$ 的条件下):在一个全是鹰派的种群中,平均收益是 $\frac{V-C}{2}$ (负值)。一个鸽派突变体虽然在对抗鹰派时收益为0,但 $0 > \frac{V-C}{2}$。因此,鸽派突变体比鹰派表现更好,能够入侵该种群。 * 混合策略是ESS:如果一个种群的个体都遵循以 $p = V/C$ 的概率扮演鹰的混合策略,那么这个种群是稳定的。任何偏离这个策略的少数突变体(无论是纯策略还是其他混合策略)的平均收益都不会高于现有种群的平均收益。因此,这个混合策略是唯一的演化稳定策略。

这解释了为什么在自然界中,动物之间的冲突常常表现为一种混合模式:有时是仪式性的展示(鸽),有时则是真刀真枪的战斗(鹰),而不是单一的、绝对的行为模式。种群中鹰派行为的比例,由斗争的代价与资源的价值之比 ($V/C$) 决定。

## 应用与启示 (Applications and Implications)

鹰鸽博弈模型为理解现实世界中的多种冲突提供了深刻的洞见:

1. 国际关系: {{{懦夫博弈}}}是其最著名的应用。两个拥核国家在危机中对峙(如古巴导弹危机),就像两辆高速对向行驶的汽车。继续前进是“鹰”,转弯避让是“鸽”。(鹰, 鹰) 的结局是核战争,是双方的最差结果。最终的均衡往往是一方做出让步(鸽),而另一方宣称胜利(鹰)。 2. 经济学: * 价格战: 两个寡头公司可以选择维持高价(鸽)或发动价格战大幅降价(鹰)。(鹰, 鹰) 会导致双方利润都严重受损。 * 劳资谈判: 工会可以威胁罢工(鹰)或选择继续谈判(鸽),而管理层可以威胁停工(鹰)或做出让步(鸽)。(鹰, 鹰) 即大规模罢工/停工,对双方都造成巨大损失。 3. 法律和诉讼: 诉讼双方可以选择坚持强硬立场直到上法庭(鹰),或者寻求庭外和解(鸽)。上法庭的成本(律师费、时间)可能非常高昂,对应代价 $C$。

总而言之,鹰鸽博弈揭示了在冲突中,一个看似非理性的、具有潜在自我毁灭性的强硬姿态(鹰派策略),可以作为一种有效的威慑工具来获取战略优势。然而,这种策略的风险在于,如果对方也采取同样的姿态,结果将是灾难性的。这使得参与者必须在收益和风险之间进行微妙的权衡。