ARTICLE

优势策略

优势策略 (Dominant Strategy) 优势策略 (Dominant Strategy),又称 占优策略 或 支配策略,是博弈论中一个基础而重要的解概念。它指的是这样一种策略:对于一个参与人而言,无论其他参与人选择何种策略,该策略给该参与人带来的支付都严格优于其所有其他可选策略。如果一个参与人存在优势策略,那么一个理性的决策者没有理由不选择它——选

浏览 5 更新 2025-10-26

优势策略 (Dominant Strategy)

优势策略 (Dominant Strategy),又称 占优策略支配策略,是博弈论中一个基础而重要的解概念。它指的是这样一种策略:对于一个参与人而言,无论其他参与人选择何种策略,该策略给该参与人带来的支付都严格优于其所有其他可选策略。如果一个参与人存在优势策略,那么一个理性的决策者没有理由不选择它——选择优势策略是最优决策,不受对其他参与人行为之预期的影响。

优势策略是博弈论中最强的个体策略性质之一。它的核心直觉在于:选择优势策略不需要任何关于对手行为的信念——它可以被视为一种"万全之策"。这种性质使得优势策略在概念上极为清晰,在预测上也最为可靠:一旦识别出优势策略,便可断言理性参与人必将采纳之,无需任何额外的协调或预期机制。这一概念由博弈论先驱在其早期分析中明确,并在囚徒困境等经典模型中得到了最直观的展示。然而,正是由于其严苛的条件——"无论对手做什么皆最优"——绝大多数现实博弈并不存在优势策略,这也是博弈论需要发展更一般化的均衡概念(如纳什均衡)的根本原因。

形式化定义 (Formal Definition)

考虑一个有 N N 个参与人的博弈。参与人 i i 的策略集为 Si S_i ,其效用函数为 ui(si,si) u_i(s_i, s_{-i}) ,其中 siSi s_i \in S_i 表示参与人 i i 的某个策略,si s_{-i} 表示其余所有参与人的策略组合。

严格优势策略 (Strictly Dominant Strategy):对于参与人 i i ,策略 siSi s_i^* \in S_i 称为严格优势策略,当且仅当对于所有 siSi s_i' \in S_i sisi s_i' \neq s_i^* ,以及对于所有可能的 si s_{-i} ,均有:

ui(si,si)>ui(si,si)u_i(s_i^*, s_{-i}) > u_i(s_i', s_{-i})

也就是说,无论对手做什么,si s_i^* 始终比任何其他策略带来严格更高的支付。

弱优势策略 (Weakly Dominant Strategy):对于参与人 i i ,策略 siSi s_i^* \in S_i 称为弱优势策略,当且仅当:

ui(si,si)ui(si,si)siSi,siu_i(s_i^*, s_{-i}) \ge u_i(s_i', s_{-i}) \quad \forall s_i' \in S_i, \forall s_{-i}

且至少存在一组 si s_{-i} ,使得不等式严格成立。弱优势策略至少不劣于任何其他策略,在某些情形下严格更优。弱优势策略在拍卖理论机制设计中尤为重要——例如,在维克里拍卖中,真实报价对每位投标人而言是弱优势策略:投标人如实报价的支付从不低于虚报,且在某些情形下严格优于虚报。严格与弱优势策略的区分对于理论上筛选均衡具有意义:严格优势策略提供唯一且确定的预测,而弱优势策略可能导致多重均衡。

优势策略均衡 (Dominant Strategy Equilibrium)

当一个博弈中 每一位参与人都拥有(严格)优势策略时,由这些优势策略所构成的策略组合即为 优势策略均衡 (Dominant Strategy Equilibrium)。优势策略均衡是博弈论中最令人满意的均衡概念:它不依赖于参与人对他人行为的一致预期,每个参与人仅仅依据自身利益最大化即可达成均衡。

优势策略均衡必然是纳什均衡,但反之不成立。事实上,绝大多数博弈并不存在优势策略均衡——这正是博弈论之所以复杂的根本原因:参与人的最优选择通常取决于对其他参与人行为的判断。

经典示例:囚徒困境 (Prisoner's Dilemma)

囚徒困境是展示优势策略最著名的模型。两名嫌疑人 A 与 B 被分别审讯,各自面临"坦白"与"沉默"两个选择。支付矩阵如下(以服刑年数的负数表示支付,数值越大越好):

\begin{tabular}{c|c|c} \& B: 沉默 \& B: 坦白 \\ \hline A: 沉默 \& (1,1)(-1, -1) \& (10,0)(-10, 0) \\ A: 坦白 \& (0,10)(0, -10) \& (5,5)(-5, -5) \\ \end{tabular}

从 A 的角度分析:若 B 沉默,A 选择坦白优于沉默(0>10 > -1);若 B 坦白,A 选择坦白同样优于沉默(5>10-5 > -10)。因此无论 B 作何决策,坦白对 A 而言都是严格优势策略。对称地,坦白也是 B 的严格优势策略。由此,(坦白, 坦白) 构成唯一的优势策略均衡,但它并非帕累托最优——双方本可通过合作实现 (-1, -1) 的更优结果。这一悖论深刻揭示了个人理性与集体理性之间的张力。

与相关概念的关系 (Relation to Related Concepts)

优势策略与纳什均衡:优势策略均衡一定是纳什均衡,但纳什均衡不一定是优势策略均衡。例如在性别之战中,不存在优势策略,却存在两个纯策略纳什均衡。

优势策略与重复剔除严格劣策略重复剔除严格劣策略 (Iterated Elimination of Strictly Dominated Strategies, IESDS) 是一种逐步剔除劣策略以缩小策略空间的方法。优势策略永远不会在这一过程中被剔除——它是最终幸存策略的天然候选。然而,IESDS 剔除了严格被占优的策略,而优势策略要求的是"总是最优",两者不可混淆。

优势策略与机制设计:在机制设计理论中,设计者通常希望构建一种博弈,使得参与人如实报告私有信息成为弱优势策略。例如,维克里拍卖 (Vickrey Auction) 便通过特殊的支付规则,使真实报价成为每位投标人的弱优势策略。这种性质被称为 策略免疫 (Strategy-Proofness)。

局限性与现实意义 (Limitations and Practical Significance)

优势策略概念虽然强大,但在现实博弈中的应用范围有限:

  1. 绝大多数真实博弈——从企业寡头竞争到国际贸易谈判——都不存在优势策略。参与人的最优选择通常高度依赖于对其他参与人行为的预期。
  2. 弱优势策略的概念虽然在理论上严谨,但在实际决策中,若"弱优势"仅在某些极端情形下严格成立,参与人可能并不认为这是一个足够强的选择理由。
  3. 在存在多个弱优势策略的情形下,该概念无法给出唯一预测。

尽管如此,优势策略仍然是博弈论教学中不可或缺的起点。它提供了一个理想化的基准:当博弈存在优势策略时,预测是确定且唯一的;当优势策略不存在时,才需要引入更复杂的均衡概念——如纳什均衡子博弈精炼纳什均衡贝叶斯纳什均衡——来分析和预测策略互动。