ARTICLE

占优策略

占优策略 (Dominant Strategy) 占优策略(Dominant Strategy)是博弈论(Game Theory)中最基础、最直观的策略概念之一。它指无论其他参与者(players)选择何种策略,某个参与者始终能获得严格更高(或至少不低)收益(payoff)的策略。当一个参与者拥有占优策略时,其最优决策完全不受他人行为影响——这种"单方面最优

浏览 3 更新 2026-07-18

占优策略 (Dominant Strategy)

占优策略(Dominant Strategy)是博弈论(Game Theory)中最基础、最直观的策略概念之一。它指无论其他参与者(players)选择何种策略,某个参与者始终能获得严格更高(或至少不低)收益(payoff)的策略。当一个参与者拥有占优策略时,其最优决策完全不受他人行为影响——这种"单方面最优"的特性使得策略选择变得简单而确定。占优策略的逆向概念是劣势策略(Dominated Strategy),即无论对手如何行动,该策略的收益总是严格低于(或至多不高于)另一个策略。

形式化定义

在标准博弈的表述中,令 nn 个参与者的集合为 N={1,2,,n}N = \{1, 2, \ldots, n\},参与者 ii 的纯策略集合为 SiS_i,其收益函数为 ui:S1×S2××SnRu_i: S_1 \times S_2 \times \cdots \times S_n \to \mathbb{R}。策略 siSis_i^* \in S_i 是参与者 ii严格占优策略(Strictly Dominant Strategy),当且仅当对于所有其他参与者的策略组合 siSis_{-i} \in S_{-i}(即 S1××Si1×Si+1××SnS_1 \times \cdots \times S_{i-1} \times S_{i+1} \times \cdots \times S_n)和所有 sisis_i \neq s_i^*,有:

ui(si,si)>ui(si,si)u_i(s_i^*, s_{-i}) > u_i(s_i, s_{-i})

如果不等式为 \ge(而非严格大于),则称 sis_i^*弱占优策略(Weakly Dominant Strategy)。严格占优策略在所有对手策略下均严格优于其他选择,而弱占优策略在某些对手行动下可能与其他策略无差异,但从未更差且至少在某些情况下严格更优。

占优策略与纳什均衡的关系

理解占优策略与纳什均衡(Nash Equilibrium)的关系,对掌握博弈论至关重要。纳什均衡要求每个参与者的策略是对其他参与者策略的最佳应对(Best Response),而占优策略则是一个更强条件——它要求策略是对所有可能的对手策略的最佳应对。因此,如果一个博弈中所有参与者都拥有占优策略,那么该占优策略组合必然构成一个纳什均衡。反之则不一定成立:许多纳什均衡(如性别之战中的两个均衡)中的策略并非占优策略,因为参与者的最优选择依赖于对手的具体行动。

经典案例:囚徒困境

囚徒困境(Prisoner's Dilemma)是展示占优策略最经典的例子。两个囚徒在分开审讯中面临选择:如果都不坦白,各获刑1年;若一人坦白另一人沉默,坦白者释放(0年),沉默者获刑10年;若都坦白,各获刑8年。从囚徒A的视角看,无论B选择坦白还是沉默,A选择坦白的收益都严格更高——若B沉默,坦白得0年优于沉默得1年;若B坦白,坦白得8年优于沉默得10年。因此,"坦白"是A的严格占优策略。同样的推理适用于B。最终双方都选择坦白,获得(8年, 8年)这一帕累托低效(Pareto Inefficient)的结果,揭示了个人理性与集体理性之间的深刻矛盾。

应用与意义

占优策略在经济学中的应用场景广泛。在拍卖理论(Auction Theory)中,第二价格拍卖(Vickrey Auction)的投标者以"如实出价"(bidding truthfully)为弱占优策略,这一特性确保了拍卖的激励相容性(Incentive Compatibility)。在公共品提供博弈(Public Goods Game)中,如果个体收益函数设计不当,"搭便车"(free-riding)可能成为占优策略,导致公共品供给不足。在产业组织(Industrial Organization)中,伯特兰价格竞争模型(Bertrand Competition)中降价争抢市场份额的行为在某些设定下也可形成占优策略。

需要特别注意的是,占优策略的存在是博弈论中的"奢侈品"而非"必需品"。大多数现实博弈的参与者的最优决策都依赖于对手的行动(即策略互补性),此时博弈论分析的重点转向最佳应对函数纳什均衡的求解。当博弈不存在占优策略时,研究者通常采用逐次剔除严格劣势策略(Iterated Elimination of Strictly Dominated Strategies)来简化博弈——这种方法假设理性的参与者不会选择劣势策略,反复剔除后可能获得博弈的解(若唯一幸存策略组合存在)。理性共识(Common Knowledge of Rationality)是该方法的认知前提:所有参与者都理性,且知道彼此理性,且知道彼此知道彼此理性,以此类推。

占优策略概念的核心价值在于为博弈论提供了一个"最简基准":当策略环境中存在占优策略时,预测变得清晰且稳健——无需假设参与者了解对手策略或具备复杂的共同知识。这使占优策略成为机制设计(Mechanism Design)和实验经济学(Experimental Economics)中备受青睐的分析工具,也使其成为博弈论入门教学中第一个引入的核心概念。