ARTICLE

纯粹策略

纯粹策略 (Pure Strategy) 纯粹策略(pure strategy)是博弈论中最基础的策略概念:参与人在其可行的行动集合中确定性地选择一个特定行动,不涉及任何随机化。形式上,在策略博弈 = N, (S_i)_i N, (u_i)_i N 中,参与人i的一个纯策略即直接选定s_i S_i,其中S_i为i的纯策略空间。与之相对的概念是混合策略:参与人

浏览 0 更新 2025-07-17

纯粹策略 (Pure Strategy)

纯粹策略(pure strategy)是博弈论中最基础的策略概念:参与人在其可行的行动集合中确定性地选择一个特定行动,不涉及任何随机化。形式上,在策略博弈Γ=N,(Si)iN,(ui)iN\Gamma = \langle N, (S_i)_{i\in N}, (u_i)_{i\in N}\rangle中,参与人ii的一个纯策略即直接选定siSis_i \in S_i,其中SiS_iii的纯策略空间。与之相对的概念是混合策略:参与人以概率分布在多个纯策略间随机化。纯策略可视为混合策略的退化特例——某一纯策略的概率权重为1,其余为0。

形式刻画

令参与人ii的纯策略集为有限集Si={si1,si2,,siki}S_i = \{s_{i1}, s_{i2}, \dots, s_{ik_i}\}。纯策略选择即从SiS_i中挑选恰好一个元素。由此,纯策略剖面(pure strategy profile)s=(s1,s2,,sn)iSis = (s_1, s_2, \dots, s_n) \in \prod_i S_i完整描述了每位参与人确定性的行动选择。在该剖面下,参与人ii的支付为ui(s)u_i(s),无需计算期望值——这是纯策略分析在计算上较混合策略简洁的根本原因。

展开型博弈中,纯策略的定义更为精细:它是参与人对博弈中每一个可能到达的信息集所指定行动的完整计划。设ii的信息集族为Hi\mathcal{H}_i,每个信息集hHih \in \mathcal{H}_i上的行动集为Ai(h)A_i(h),则ii的纯策略是一个映射si:HihAi(h)s_i: \mathcal{H}_i \to \bigcup_h A_i(h),满足si(h)Ai(h)s_i(h) \in A_i(h)。这一"全盘计划"式的定义确保了策略的完备性——无论博弈如何演进,参与人始终有一个确定的行动方案。

纯策略纳什均衡

纯策略纳什均衡(Pure Strategy Nash Equilibrium, PSNE)是策略博弈的核心解概念。纯策略剖面s=(s1,,sn)s^* = (s_1^*, \dots, s_n^*)构成一个纯策略纳什均衡,当且仅当对于每位参与人ii和其每一个可选纯策略siSis_i \in S_i,满足:

ui(si,si)ui(si,si)siSiu_i(s_i^*, s_{-i}^*) \geq u_i(s_i, s_{-i}^*) \quad \forall s_i \in S_i

换言之,给定他人策略不变,没有任何参与人可通过单方面偏离至另一纯策略而严格提高自身支付。纯策略纳什均衡具有"自执行"性质:一旦达成,无人有动力单方面改变行为。

经典示例

囚徒困境:存在唯一纯策略纳什均衡

囚徒困境中,两嫌犯各可选"坦白"(Confess)或"沉默"(Silent)。支付矩阵如下(行玩家在前):

沉默坦白沉默(1,1)(10,0)坦白(0,10)(5,5)\begin{array}{c|cc} & \text{沉默} & \text{坦白} \\ \hline \text{沉默} & (-1,-1) & (-10,0) \\ \text{坦白} & (0,-10) & (-5,-5) \end{array}

"坦白"对双方均为严格占优策略:无论对方如何选择,坦白的支付始终更高。因此(坦白, 坦白)是唯一的纯策略纳什均衡——尽管(沉默, 沉默)帕累托优于该均衡,却非个人理性可维持的结果。

性别之战:多重纯策略均衡

性别之战(Battle of the Sexes)的支付矩阵为:

拳击芭蕾拳击(2,1)(0,0)芭蕾(0,0)(1,2)\begin{array}{c|cc} & \text{拳击} & \text{芭蕾} \\ \hline \text{拳击} & (2,1) & (0,0) \\ \text{芭蕾} & (0,0) & (1,2) \end{array}

该博弈存在两个纯策略纳什均衡:(拳击, 拳击)与(芭蕾, 芭蕾)。多重均衡带来的均衡选择问题是纯策略分析的重要挑战。

猜硬币:纯策略均衡不存在

猜硬币(Matching Pennies)博弈则揭示了纯策略纳什均衡可能不存在的情形:

HTH(1,1)(1,1)T(1,1)(1,1)\begin{array}{c|cc} & H & T \\ \hline H & (1,-1) & (-1,1) \\ T & (-1,1) & (1,-1) \end{array}

任意纯策略组合下,总有一方可通过翻转硬币而获益。该博弈没有纯策略纳什均衡——唯一均衡为双方以(12,12)(\frac{1}{2}, \frac{1}{2})混合。正是这类情形的存在,推动了混合策略概念的引入与纳什存在性定理的证明。

存在性与识别

纯策略纳什均衡的存在性并非必然(猜硬币即反例),但存在若干可验证的充分条件。若博弈为超模博弈(supermodular game)——策略集为格且支付函数满足递增差分性质——则纯策略纳什均衡必存在,且均衡集本身构成完备格(Topkis, 1998)。潜在博弈(potential game)亦保证纯策略均衡的存在性:若存在势函数P:SRP: S \to \mathbb{R}使得对任意参与人ii和任意偏离sisis_i \to s_i'ui(si,si)ui(si,si)=P(si,si)P(si,si)u_i(s_i', s_{-i}) - u_i(s_i, s_{-i}) = P(s_i', s_{-i}) - P(s_i, s_{-i}),则势函数的任一极大值点即为纯策略纳什均衡(MondererShapley, 1996)。

识别纯策略均衡的实用方法包括:占优消去法——反复删除严格劣策略直至收敛;最优反应对应法——求各参与人最优反应对应的交点;以及有限博弈中的枚举验证——逐一检查每个策略剖面是否满足均衡条件。

与混合策略的关系

纯策略与混合策略之间并非割裂,而存在深刻的联系。首先,纯策略在拓扑上构成混合策略单纯形Δ(Si)\Delta(S_i)的极点——任意混合策略均可表示为纯策略的凸组合。其次,哈桑伊(Harsanyi, 1973)的净化定理为纯策略与混合策略建立了理论桥梁:混合策略均衡可视为纯策略均衡在收益受微小私人信息扰动时的极限形式——参与人看似在随机化,实则观察私人信号后纯策略地最优反应。此外,在进化博弈论中,进化稳定策略(ESS)必须为纯策略的条件与种群动态密切相关。

经济应用

纯策略分析贯穿博弈论的经济应用。在寡头竞争中,古诺模型的产量选择为纯策略,均衡即古诺-纳什均衡产出向量;伯特兰竞争中价格设定亦属纯策略。拍卖理论中,密封第一价格拍卖的纯策略报价函数是分析基准。机制设计中,设计者常希望参与人如实报告私人信息构成纯策略均衡——即占优策略激励相容。在契约理论中,纯策略刻画了委托人与代理人面对激励相容约束参与约束时的确定行为。

纯策略概念的历史可追溯至博弈论的奠基时期。冯·诺依曼摩根斯特恩(1944)在《博弈论与经济行为》中首次以纯策略为起点系统构建博弈的策略空间,并在此基础上引入混合策略以解决零和博弈中纯策略均衡缺失的问题。约翰·纳什(1950)将纯策略的分析框架推广至n人非零和博弈,证明了混合策略均衡的一般存在性,从而确立了纯策略在博弈论概念体系中的基础地位。

总之,纯粹策略是博弈论的语言基础——它既是最简单的策略形式,又深刻关联着混合策略、均衡精炼与博弈论应用的各个维度。理解纯策略及其均衡,是进入博弈论大厦的第一步。