ARTICLE

优势策略

优势策略 (Dominant Strategy) 优势策略 (Dominant Strategy)，又称占优策略或支配策略，是博弈论中一个基础而重要的解概念。它指的是这样一种策略：对于一个参与人而言，无论其他参与人选择何种策略，该策略给该参与人带来的支付都严格优于其所有其他可选策略。如果一个参与人存在优势策略，那么一个理性的决策者没有理由不选择它——选

浏览 5 更新 2025-10-26

优势策略 (Dominant Strategy)

优势策略 (Dominant Strategy)，又称 占优策略 或 支配策略，是博弈论中一个基础而重要的解概念。它指的是这样一种策略：对于一个参与人而言，无论其他参与人选择何种策略，该策略给该参与人带来的支付都严格优于其所有其他可选策略。如果一个参与人存在优势策略，那么一个理性的决策者没有理由不选择它——选择优势策略是最优决策，不受对其他参与人行为之预期的影响。

优势策略是博弈论中最强的个体策略性质之一。它的核心直觉在于：选择优势策略不需要任何关于对手行为的信念——它可以被视为一种"万全之策"。这种性质使得优势策略在概念上极为清晰，在预测上也最为可靠：一旦识别出优势策略，便可断言理性参与人必将采纳之，无需任何额外的协调或预期机制。这一概念由博弈论先驱在其早期分析中明确，并在囚徒困境等经典模型中得到了最直观的展示。然而，正是由于其严苛的条件——"无论对手做什么皆最优"——绝大多数现实博弈并不存在优势策略，这也是博弈论需要发展更一般化的均衡概念（如纳什均衡）的根本原因。

形式化定义 (Formal Definition)

考虑一个有 $N$ 个参与人的博弈。参与人 $i$ 的策略集为 $S_i$ ，其效用函数为 $u_i(s_i, s_{-i})$ ，其中 $s_i \in S_i$ 表示参与人 $i$ 的某个策略， $s_{-i}$ 表示其余所有参与人的策略组合。

严格优势策略 (Strictly Dominant Strategy)：对于参与人 $i$ ，策略 $s_i^* \in S_i$ 称为严格优势策略，当且仅当对于所有 $s_i' \in S_i$ 且 $s_i' \neq s_i^*$ ，以及对于所有可能的 $s_{-i}$ ，均有：

u_i(s_i^*, s_{-i}) > u_i(s_i', s_{-i})

也就是说，无论对手做什么， $s_i^*$ 始终比任何其他策略带来严格更高的支付。

弱优势策略 (Weakly Dominant Strategy)：对于参与人 $i$ ，策略 $s_i^* \in S_i$ 称为弱优势策略，当且仅当：

u_i(s_i^*, s_{-i}) \ge u_i(s_i', s_{-i}) \quad \forall s_i' \in S_i, \forall s_{-i}

且至少存在一组 $s_{-i}$ ，使得不等式严格成立。弱优势策略至少不劣于任何其他策略，在某些情形下严格更优。弱优势策略在拍卖理论和机制设计中尤为重要——例如，在维克里拍卖中，真实报价对每位投标人而言是弱优势策略：投标人如实报价的支付从不低于虚报，且在某些情形下严格优于虚报。严格与弱优势策略的区分对于理论上筛选均衡具有意义：严格优势策略提供唯一且确定的预测，而弱优势策略可能导致多重均衡。

优势策略均衡 (Dominant Strategy Equilibrium)

当一个博弈中 每一位参与人都拥有（严格）优势策略时，由这些优势策略所构成的策略组合即为 优势策略均衡 (Dominant Strategy Equilibrium)。优势策略均衡是博弈论中最令人满意的均衡概念：它不依赖于参与人对他人行为的一致预期，每个参与人仅仅依据自身利益最大化即可达成均衡。

优势策略均衡必然是纳什均衡，但反之不成立。事实上，绝大多数博弈并不存在优势策略均衡——这正是博弈论之所以复杂的根本原因：参与人的最优选择通常取决于对其他参与人行为的判断。

经典示例：囚徒困境 (Prisoner's Dilemma)

囚徒困境是展示优势策略最著名的模型。两名嫌疑人 A 与 B 被分别审讯，各自面临"坦白"与"沉默"两个选择。支付矩阵如下（以服刑年数的负数表示支付，数值越大越好）：

\begin{tabular}{c|c|c} \& B: 沉默 \& B: 坦白 \\ \hline A: 沉默 \& $(-1, -1)$ \& $(-10, 0)$ \\ A: 坦白 \& $(0, -10)$ \& $(-5, -5)$ \\ \end{tabular}

从 A 的角度分析：若 B 沉默，A 选择坦白优于沉默（ $0 > -1$ ）；若 B 坦白，A 选择坦白同样优于沉默（ $-5 > -10$ ）。因此无论 B 作何决策，坦白对 A 而言都是严格优势策略。对称地，坦白也是 B 的严格优势策略。由此，(坦白, 坦白) 构成唯一的优势策略均衡，但它并非帕累托最优——双方本可通过合作实现 (-1, -1) 的更优结果。这一悖论深刻揭示了个人理性与集体理性之间的张力。

与相关概念的关系 (Relation to Related Concepts)

优势策略与纳什均衡：优势策略均衡一定是纳什均衡，但纳什均衡不一定是优势策略均衡。例如在性别之战中，不存在优势策略，却存在两个纯策略纳什均衡。

优势策略与重复剔除严格劣策略：重复剔除严格劣策略 (Iterated Elimination of Strictly Dominated Strategies, IESDS) 是一种逐步剔除劣策略以缩小策略空间的方法。优势策略永远不会在这一过程中被剔除——它是最终幸存策略的天然候选。然而，IESDS 剔除了严格被占优的策略，而优势策略要求的是"总是最优"，两者不可混淆。

优势策略与机制设计：在机制设计理论中，设计者通常希望构建一种博弈，使得参与人如实报告私有信息成为弱优势策略。例如，维克里拍卖 (Vickrey Auction) 便通过特殊的支付规则，使真实报价成为每位投标人的弱优势策略。这种性质被称为 策略免疫 (Strategy-Proofness)。

局限性与现实意义 (Limitations and Practical Significance)

优势策略概念虽然强大，但在现实博弈中的应用范围有限：

绝大多数真实博弈——从企业寡头竞争到国际贸易谈判——都不存在优势策略。参与人的最优选择通常高度依赖于对其他参与人行为的预期。
弱优势策略的概念虽然在理论上严谨，但在实际决策中，若"弱优势"仅在某些极端情形下严格成立，参与人可能并不认为这是一个足够强的选择理由。
在存在多个弱优势策略的情形下，该概念无法给出唯一预测。

尽管如此，优势策略仍然是博弈论教学中不可或缺的起点。它提供了一个理想化的基准：当博弈存在优势策略时，预测是确定且唯一的；当优势策略不存在时，才需要引入更复杂的均衡概念——如纳什均衡、子博弈精炼纳什均衡和贝叶斯纳什均衡——来分析和预测策略互动。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。