ARTICLE

纯策略 (Pure Strategy)

纯策略 (Pure Strategy) 纯策略 (Pure Strategy) 是博弈论中最基本的策略概念,指参与者在博弈的每一个决策情境中确定性地选择一个特定行动,而不引入任何随机化机制。直观上,纯策略是对"做什么"的明确指令——不掷骰子、不混合、不模糊,是一个没有概率内涵的确定选择。它与混合策略 (Mixed Strategy) 形成对照,后者允许参与者

浏览 0 更新 2025-12-20

纯策略 (Pure Strategy)

纯策略 (Pure Strategy) 是博弈论中最基本的策略概念,指参与者在博弈的每一个决策情境中确定性地选择一个特定行动,而不引入任何随机化机制。直观上,纯策略是对"做什么"的明确指令——不掷骰子、不混合、不模糊,是一个没有概率内涵的确定选择。它与混合策略 (Mixed Strategy) 形成对照,后者允许参与者按某种概率分布在多个纯策略之间随机化。

纯策略是博弈论大厦的砖石:规范形博弈由纯策略集合直接定义,纳什均衡的概念首先在纯策略层面上被表述,而纳什存在性定理也正是通过将博弈从纯策略空间扩展到混合策略单纯形才得以证明。理解纯策略的形式结构与局限性,是进入博弈论分析的第一步。

形式化定义

在一个具有 nn 个参与者的规范形博弈 G=N,{Si}iN,{ui}iNG = \langle N, \{S_i\}_{i \in N}, \{u_i\}_{i \in N} \rangle 中:

  • N={1,2,,n}N = \{1, 2, \ldots, n\} 为有限参与者集合。
  • 对每个参与者 ii,其纯策略空间 Si={si1,si2,,simi}S_i = \{s_{i1}, s_{i2}, \ldots, s_{im_i}\} 是一个有限集合,包含 mim_i 个互斥的行动选项。每个元素 sijSis_{ij} \in S_i 即为参与者 ii 的一个纯策略
  • ui:SRu_i: S \to \mathbb{R} 是参与者 ii支付函数,其中 S=iNSiS = \prod_{i \in N} S_i 为所有纯策略组合的笛卡尔积空间。

一个纯策略组合 (Pure Strategy Profile) 是一个 nn 元组 s=(s1,,sn)S\mathbf{s} = (s_1, \ldots, s_n) \in S,它完整描述了每位参与者选择的具体行动。在支付矩阵中,每一个单元格恰好对应一个纯策略组合。纯策略组合的总数为 i=1nmi\prod_{i=1}^{n} m_i,即各参与者策略数量之积。

展开型博弈 (Extensive Form Game) 中,纯策略的定义更复杂:它是一个完整计划 (Complete Plan),为参与者的每一个信息集指定一项可行的行动,即使该信息集在实际博弈路径上可能不会被到达。这一"全信息集覆盖"的要求意味着策略数量随信息集数量呈指数增长,这也是展开型博弈向规范形转换时维度膨胀的根本原因。

纯策略与混合策略的关系

纯策略可视为混合策略的退化特例。给定纯策略空间 SiS_i,参与者 ii 的一个混合策略 σi\sigma_iSiS_i 上的概率分布:

σiΔ(Si)={(p1,,pmi)  |  pj0,  j=1mipj=1}\sigma_i \in \Delta(S_i) = \left\{ (p_1, \ldots, p_{m_i}) \;\middle|\; p_j \ge 0,\; \sum_{j=1}^{m_i} p_j = 1 \right\}

σi\sigma_i 以概率 11 赋予某个特定纯策略 siks_{ik} 时,该混合策略在行为上等价于直接使用纯策略 siks_{ik}。此时混合策略单纯形的顶点与纯策略一一对应。因此,混合策略是纯策略的凸扩展,而纯策略集合是混合策略单纯形的极点集

这一凸性关系在纳什存在性定理的证明中至关重要:纯策略空间 SiS_i 是离散有限的,最优反应对应可能不满足不动点条件;而混合策略单纯形 Δ(Si)\Delta(S_i) 是紧凸集,支付函数的期望形式在自身策略上是线性的(因而拟凹),使角谷不动点定理得以应用。

纯策略纳什均衡

一个纯策略组合 s=(s1,,sn)\mathbf{s}^* = (s_1^*, \ldots, s_n^*)纯策略纳什均衡 (Pure Strategy Nash Equilibrium, PSNE) 当且仅当:

iN,  siSi:ui(si,si)ui(si,si)\forall i \in N,\; \forall s_i \in S_i: \quad u_i(s_i^*, \mathbf{s}_{-i}^*) \ge u_i(s_i, \mathbf{s}_{-i}^*)

即:给定所有其他参与者的均衡策略 si\mathbf{s}_{-i}^*,没有任何参与者可以通过单方面偏离到另一个纯策略而获得更高支付。纯策略纳什均衡是策略组合空间中的不动点:每位参与者的策略恰好是对他人策略的最优反应。

存在性与非存在性

纯策略纳什均衡并非总是存在。经典反例如下:

猜硬币博弈 (Matching Pennies):两人各选择硬币的正面或反面。若两面一致,参与者 1 赢得 1 单位;若不一致,参与者 2 赢得 1 单位。支付矩阵为:

HTH(1,1)(1,1)T(1,1)(1,1)\begin{array}{c|cc} & H & T \\ \hline H & (1, -1) & (-1, 1) \\ T & (-1, 1) & (1, -1) \end{array}

逐一检查四种纯策略组合:(H,H)(H, H) 下参与者 2 有动机偏离至 TT(获得 +1+1 而非 1-1);其余三个组合同理。该博弈不存在任何纯策略纳什均衡,唯一的纳什均衡是双方各以 1/21/2 概率选择正面的混合策略。

类似地,石头剪刀布 (Rock-Paper-Scissors) 也因三种策略的循环克制关系而不存在纯策略纳什均衡。纯策略均衡的不存在性直接体现了某些策略互动在确定性框架下的根本张力:任何固定的行动模式都可能被对手预测并利用。

求解纯策略纳什均衡

在小型有限博弈中,纯策略纳什均衡可通过划线法 (Underlining Method) 直观求解:对每位参与者,在给定对手每种策略时标记己方的最优反应(在支付矩阵相应单元格中划线),双方相互标记的单元格即为纯策略纳什均衡。以囚徒困境为例:

抵赖坦白抵赖(1,1)(10,0)坦白(0,10)(5,5)\begin{array}{c|cc} & \text{抵赖} & \text{坦白} \\ \hline \text{抵赖} & (-1, -1) & (-10, 0) \\ \text{坦白} & (0, -10) & (-5, -5) \end{array}

行参与者:"对方抵赖时坦白更好,对方坦白时坦白更好"——坦白两处被划线;列参与者同理。仅(坦白, 坦白)被双方同时划线,即唯一的纯策略纳什均衡。该博弈中优势策略的存在使均衡唯一且与对手策略无关。

对于性别战 (Battle of the Sexes)等不存在优势策略的协调博弈,划线法同时标记出多个均衡,揭示了均衡多重性带来的协调问题。

纯策略在博弈论中的地位

纯策略概念在博弈论的多个层面发挥基础性作用:

  1. 作为混合策略的支撑集:任何混合策略均衡的分析都建立在纯策略集合之上。无差异条件要求:在均衡中,被赋予正概率的各纯策略必须产生相等的期望支付。纯策略的支付结构决定了混合均衡的概率权重。
  2. 作为策略空间的代数基础Δ(Si)\Delta(S_i) 的维数为 Si1|S_i| - 1,整个混合策略空间的几何与拓扑性质完全由纯策略的数量决定。超模博弈、势博弈等特殊博弈类中纯策略纳什均衡的存在性与唯一性结论(如 Tarski 不动点定理)亦直接依赖于纯策略集合上的序结构。
  3. 作为均衡精炼的起点子博弈完美均衡颤抖手均衡等精炼概念均以纯策略为基础构造扰动。Selten 的"颤抖手"定义直接在纯策略的代理形式(agent-normal form)上施加微小扰动,检验均衡在策略微小偏离下的稳健性。
  4. 应用的直观可解释性:在实证和实验经济学中,纯策略均衡因其确定性而更易于检验和解释。许多经济模型(拍卖中的出价、契约设计中的菜单选择、投票行为等)的均衡预测都是纯策略形式。

关键洞察

纯策略的简洁性既是其力量所在,也是其局限所在。它提供了清晰的行动指令和直观的均衡概念,但当博弈结构存在内在的循环克制或信息不对称时,确定性本身成为弱点。混合策略不是对理性的背离,而是在"被对手看透"的风险与"保持不可预测"的需要之间建立的理性均衡。因此,纯策略与混合策略并非对立,而是刻画策略互动中确定性与随机性两种基本力量的互补工具。理解纯策略在何种条件下能构成均衡、在何种条件下必须向混合策略扩展,是博弈论分析的核心直觉之一。