ARTICLE
纯策略
纯策略(Pure Strategy)是博弈论中的一个核心概念,指参与人在博弈过程中以确定性方式选择单一行动路径的策略,与之相对的是混合策略(Mixed Strategy)。在纯策略框架下,参与人在每一个决策节点上以概率1选择某一个特定行动,不存在随机化。纯策略构成博弈分析的基础,也是纳什均衡(Nash Equilibrium)研究中最先被考察的策略类型。 定
纯策略(Pure Strategy)是博弈论中的一个核心概念,指参与人在博弈过程中以确定性方式选择单一行动路径的策略,与之相对的是混合策略(Mixed Strategy)。在纯策略框架下,参与人在每一个决策节点上以概率1选择某一个特定行动,不存在随机化。纯策略构成博弈分析的基础,也是纳什均衡(Nash Equilibrium)研究中最先被考察的策略类型。
定义与形式化表示
在标准博弈论模型中,博弈由参与人集合、每个参与人的策略空间以及收益函数构成。给定一个参与人 ,其纯策略空间 包含所有可供选择的纯策略。若参与人 从 中确定性地选取一个策略 ,则称其采用了纯策略。相应地,纯策略组合(Pure Strategy Profile)是一个向量 ,表示每个参与人各自选择了一个纯策略。
纯策略可以进一步区分为纯策略(在扩展式博弈中每一信息集上指定一个唯一行动)和行为策略(Behavior Strategy),但在完全信息博弈中二者等价(Kuhn定理)。
纯策略纳什均衡
纯策略纳什均衡是指一组纯策略组合,使得任何参与人单方面偏离其策略都无法获得更高收益。寻找纯策略纳什均衡是博弈分析的基本任务之一。在有限博弈中,纯策略纳什均衡不一定存在,经典例子包括剪刀石头布(Rock-Paper-Scissors)等零和博弈,其唯一的纳什均衡是混合策略均衡。
存在性条件
根据纳什定理,任何有限博弈至少存在一个混合策略纳什均衡,但纯策略纳什均衡的存在需要更强的条件。对于连续策略空间的博弈,如古诺竞争(Cournot Competition)中的产量选择,若收益函数是拟凹的且策略空间是紧凸集,则纯策略纳什均衡存在(Debreu–Glicksberg–Fan定理)。对于超模博弈(Supermodular Game),纯策略纳什均衡的存在性可由格理论(Lattice Theory)中的塔斯基不动点定理保证。
纯策略与混合策略的关系
纯策略是混合策略的特例。混合策略是定义在纯策略空间上的概率分布:若参与人只有两个纯策略 ,则一个混合策略可以表示为 ,其中 是选择 的概率,当 或 时混合策略退化为纯策略。
在博弈求解中,若一个博弈不存在纯策略纳什均衡,则需要引入混合策略来寻找均衡。囚徒困境(Prisoner's Dilemma)虽然存在纯策略纳什均衡(双方背叛),但协调博弈(Coordination Game)则可能存在多个纯策略纳什均衡,产生均衡选择问题。
典型案例分析
囚徒困境的纯策略分析
囚徒困境是最经典的纯策略博弈示例。两名囚徒各有两种纯策略:合作(C)或背叛(D)。收益矩阵如下:
- 若双方均合作,各得-1(轻刑);
- 若一方背叛、一方合作,背叛者得0(释放),合作者得-10(重刑);
- 若双方均背叛,各得-8(中等刑期)。
在该博弈中,背叛是每个参与人的严格占优策略,因此(背叛,背叛)是唯一的纯策略纳什均衡。这一结果揭示了个人理性与集体理性之间的冲突。
性别战博弈中的多重均衡
性别战博弈(Battle of the Sexes)展示了纯策略纳什均衡的多重性问题。夫妻二人需要决定去听歌剧还是看拳击。若两人选择相同活动则各自获得正收益,但在不同活动中收益分配不同。该博弈存在两个纯策略纳什均衡:(歌剧,歌剧)和(拳击,拳击),同时存在一个混合策略均衡。多重纯策略均衡的出现给均衡预测带来了挑战,需要借助谢林点(Schelling Point)、风险占优(Risk Dominance)等辅助概念进行精炼。
纯策略在博弈求解中的重要性
纯策略分析是理解更复杂博弈行为的起点。在重复博弈中,参与人的纯策略可以非常复杂:在无限重复囚徒困境中,"以牙还牙"(Tit-for-Tat)就是一种纯策略,它规定参与人在每一期重复对手上一期的行动。在演化博弈论中,纯策略被视为种群中的"类型"(Type),演化稳定策略(Evolutionarily Stable Strategy, ESS)通常是纯策略或混合策略的某种形式。
在机制设计和拍卖理论中,纯策略均衡通常作为基准解概念。例如,在一级密封价格拍卖中,若竞拍者的估值独立同分布,贝叶斯纳什均衡是纯策略出价函数,该函数严格递增,反映了参与人的真实估值信息。在双边拍卖(Double Auction)中,买卖双方同时报价,若存在纯策略均衡,则交易效率可以达到较高水平,查特吉-萨缪尔森模型(Chatterjee-Samuelson Model)对此有经典论述。
总结
纯策略是博弈论中最基础、最直观的策略概念,它要求参与人以确定性的方式行动。尽管并非所有博弈都存在纯策略纳什均衡,但在大量经济模型——如古诺竞争、伯特兰竞争、公共品博弈、讨价还价模型——中,纯策略纳什均衡是分析和预测的核心工具。
纯策略的适用性并不仅限于完全信息静态博弈。在不完全信息博弈(贝叶斯博弈)中,纯策略表现为类型依存行动函数(Type-Contingent Action),每个参与人根据自身类型选择单一行动,构成贝叶斯纳什均衡的基础。在信号博弈(Signaling Game)中,纯策略均衡分为分离均衡(Separating Equilibrium)、混同均衡(Pooling Equilibrium)和半分离均衡(Semi-Separating Equilibrium),这些均衡概念在经济学的劳动力市场信号模型(Spence模型)中有着重要应用。
理解纯策略的性质、存在条件及其与混合策略的关系,是掌握博弈论分析的必备基础。对于经济学研究者而言,熟练掌握纯策略纳什均衡的求解方法——包括划线法、逆向归纳法、最优反应函数法——是进行经济模型分析的前提条件。