知经 KNOWECON · 卓越的经济金融统计数学学习平台

对称混合策略纳什均衡

# 对称混合策略纳什均衡 (Symmetric Mixed Strategy Nash Equilibrium)

对称混合策略纳什均衡是{{{博弈论}}} (Game Theory) 中的一个核心均衡概念,特指在对称博弈中,所有参与者都采用完全相同的{{{混合策略}}},并且在这种策略组合下,没有任何一个参与者有动机单方面改变自己的策略。

这个术语可以分解为三个关键部分来理解:

1. {{{纳什均衡 (Nash Equilibrium)}}}:这是一种策略组合,其中每个参与者的策略都是对其余参与者策略的最佳回应。也就是说,在给定他人策略的情况下,没有人能通过单方面改变自己的策略来获得更高的{{{收益 (Payoff)}}}。 2. {{{混合策略 (Mixed Strategy)}}}:与{{{纯策略 (Pure Strategy)}}}(即每次都确定地选择一个特定行动)相对,混合策略是参与者在一个行动集合中,为每个纯策略分配一个概率,并根据这个概率分布来随机选择其行动。 3. 对称 (Symmetric):这指的是两个层面上的对称。首先,博弈本身是对称博弈 (Symmetric Game),意味着所有参与者的身份可以互换,他们拥有相同的策略集,并且在面对相同的对手策略时,采用相同策略所获得的收益也完全相同。其次,均衡策略本身是对称的,即所有参与者都采用完全相同的混合策略。

因此,一个对称混合策略纳什均衡描述了一个稳定的状态,其中所有匿名的、处境相同的参与者都以相同的概率组合来随机化他们的行为。

## 核心原理:无差异原则

求解混合策略纳什均衡的关键在于理解并应用无差异原则 (Indifference Principle)。该原则指出:

> 在一个混合策略纳什均衡中,如果一个参与者以正的概率选择多个纯策略,那么他/她从这些纯策略中获得的{{{期望收益 (Expected Payoff)}}}必须是完全相等的。

这个逻辑非常直观:如果其中一个纯策略能带来严格更高的期望收益,那么一个理性的参与者就会放弃随机化,而以100%的概率选择那个更优的策略。因此,参与者之所以愿意“混合”或“随机化”他的选择,前提必定是他对于选择哪个行动是“无差异的”。

在对称混合策略纳什均衡的求解中,我们正是利用这一原则,假设所有其他参与者都采用某个待定的混合策略 $(p_1, p_2, $...$)$,然后为一个参与者建立方程,使其选择各个纯策略的期望收益相等,最后解出概率 $p$ 的值。

## 如何求解:一个计算示例

我们可以通过一个经典的“懦夫博弈 (Game of Chicken)”模型来演示求解过程。假设两个车手同时向对方开车,每个人都有两个选择:转向 (Swerve)直行 (Straight)。其收益矩阵如下((玩家1收益, 玩家2收益)):

| | 玩家2: 直行 | 玩家2: 转向 | | :--- | :--- | :--- | | 玩家1: 直行| (-10, -10) | (1, -1) | | 玩家1: 转向| (-1, 1) | (0, 0) |

这个博弈是{{{对称博弈}}},因为交换两个玩家的位置,收益矩阵保持不变。该博弈存在两个纯策略纳什均衡:(直行, 转向) 和 (转向, 直行)。但是,这两个均衡都不是对称的。现在我们来寻找其对称的混合策略纳什均衡。

步骤 1:设定对称混合策略

假设两个玩家都采用相同的混合策略:以概率 $p$ 选择“直行”,以概率 $1-p$ 选择“转向”。

步骤 2:应用无差异原则

我们站在玩家1的视角。为了让玩家1愿意混合他的策略,他选择“直行”和“转向”的期望收益必须相等。我们基于玩家2会以概率 $p$ 直行,概率 $1-p$ 转向的假设来计算玩家1的期望收益。

* 玩家1选择“直行”的期望收益 $E_1(\text{直行})$: 玩家1的收益取决于玩家2的选择。玩家2有 $p$ 的概率选择“直行”(玩家1收益-10),有 $1-p$ 的概率选择“转向”(玩家1收益1)。 $$ E_1(\text{直行}) = p \cdot (-10) + (1-p) \cdot 1 = -10p + 1 - p = 1 - 11p $$

* 玩家1选择“转向”的期望收益 $E_1(\text{转向})$: 玩家2有 $p$ 的概率选择“直行”(玩家1收益-1),有 $1-p$ 的概率选择“转向”(玩家1收益0)。 $$ E_1(\text{转向}) = p \cdot (-1) + (1-p) \cdot 0 = -p $$

根据无差异原则,令这两个期望收益相等: $$ E_1(\text{直行}) = E_1(\text{转向}) $$ $$ 1 - 11p = -p $$

步骤 3:求解概率 $p$

现在我们可以解这个简单的线性方程: $$ 1 = 11p - p $$ $$ 1 = 10p $$ $$ p = \frac{1}{10} = 0.1 $$

步骤 4:得出均衡策略

我们求得 $p=0.1$。这意味着,当两个玩家都以10%的概率选择“直行”,90%的概率选择“转向”时,系统达到了一个对称混合策略纳什均衡。

在这个均衡中,每个玩家选择“直行”的期望收益是 $E_1(\text{直行}) = 1 - 11(0.1) = -0.1$,选择“转向”的期望收益是 $E_1(\text{转向}) = -0.1$。两者确实相等,因此没有玩家有动机改变自己0.1的“直行”概率。

## 重要性与应用

对称混合策略纳什均衡是{{{经济学}}}和{{{演化博弈论 (Evolutionary Game Theory)}}}等领域中一个极其强大的工具。

* 保证均衡的存在性:根据{{{纳什存在性定理 (Nash's Existence Theorem)}}},任何有限参与者和有限策略的博弈都至少存在一个纳什均衡(在混合策略下)。对于像{{{石头剪刀布 (Rock-Paper-Scissors)}}}这样没有纯策略纳什均衡的对称博弈,其唯一的均衡就是对称混合策略纳什均衡(即各以1/3的概率出拳)。 * 解释市场和群体行为:在经济学中,它可以用来模拟多个相同企业(例如,在{{{寡头垄断 (Oligopoly)}}}市场中)的定价或广告策略。当没有一个确定的价格能成为稳定策略时,企业可能会随机化其定价。 * 演化稳定策略 (Evolutionarily Stable Strategy, ESS):在生物学和演化博弈论中,对称混合策略纳什均衡与演化稳定策略的概念紧密相关。它可以解释一个物种内部为何会存在不同行为模式的稳定比例。例如,在{{{鹰鸽博弈 (Hawk-Dove Game)}}}中,均衡时的混合策略概率可以被解释为一个群体中“鹰派”和“鸽派”个体所占的稳定比例。 * 随机性和不可预测性:在安全、体育等领域,混合策略是必要的。例如,在足球点球大战中,守门员和踢球者都采用混合策略来让对方无法预测自己的行为。对称混合策略纳什均衡可以精确计算在这种对抗中双方的最佳随机化比例。