ARTICLE

strategy

策略 (Strategy) 策略(Strategy)是博弈论中最基本的概念之一,指参与人在博弈中每一个可能的信息集上所选择的完整行动计划。策略不同于简单的"动作"(Action):它是一套相机抉择的完备方案(Contingent Plan),规定了博弈树中每个决策节点上参与人将如何行动,无论该节点在实际博弈中是否会被到达。这一概念由冯·诺依曼与摩根斯坦在19

浏览 5 更新 2025-10-29

策略 (Strategy)

策略(Strategy)是博弈论中最基本的概念之一,指参与人在博弈中每一个可能的信息集上所选择的完整行动计划。策略不同于简单的"动作"(Action):它是一套相机抉择的完备方案(Contingent Plan),规定了博弈树中每个决策节点上参与人将如何行动,无论该节点在实际博弈中是否会被到达。这一概念由冯·诺依曼摩根斯坦在1944年出版的《博弈论与经济行为》中首次系统化,并由纳什等学者在均衡理论中进一步深化。

策略的类型

博弈论按信息结构和博弈形式区分以下主要策略类型。

纯策略(Pure Strategy)是最简单的形式,指参与人在每个信息集上确定地选择某一特定动作。在囚徒困境中,"总是坦白"和"总是抵赖"各为一个纯策略。若博弈具有有限个纯策略,参与人的策略空间即为所有纯策略构成的集合。

混合策略(Mixed Strategy)指参与人在纯策略集合上赋予一个概率分布,以随机化方式选择行动。混合策略的必要性源于两类情形:一是博弈不存在纯策略纳什均衡(如匹配便士游戏),必须以混合策略实现均衡;二是在不完全信息博弈中,随机化行为可以传达或隐藏信息。形式化地,令参与人 ii 的纯策略集合为 Si={si1,si2,,sik}S_i = \{s_{i1}, s_{i2}, \ldots, s_{ik}\},则其混合策略 σi\sigma_i 是一个在 SiS_i 上的概率分布:

σi=(pi1,pi2,,pik),j=1kpij=1,pij0\sigma_i = (p_{i1}, p_{i2}, \ldots, p_{ik}), \quad \sum_{j=1}^{k} p_{ij} = 1, \quad p_{ij} \geq 0

其中 pijp_{ij} 表示参与人 ii 选择纯策略 sijs_{ij} 的概率。纯策略可视为混合策略在某一分量概率为1时的退化情形。

行为策略(Behavioral Strategy)适用于扩展式博弈,指参与人在每个信息集上分别独立随机化,而非在整个纯策略空间上一次性随机化。库恩定理(Kuhn's Theorem)指出,在完美回忆(Perfect Recall)条件下,行为策略与混合策略等价,二者可产生相同的博弈结果分布。

支配策略(Dominant Strategy)是一类特殊的策略:无论其他参与人如何选择,该策略给参与人带来的收益均严格高于(严格支配)或不低于(弱支配)其他所有策略。若每个参与人都拥有严格支配策略,博弈的均衡即为支配策略均衡(Dominant Strategy Equilibrium),囚徒困境即为此类博弈的经典例证。

策略与纳什均衡

纳什均衡的定义直接建立在策略概念之上:在一个策略组合(Strategy Profile)中,给定其他参与人的策略不变,没有任何参与人可以通过单方面偏离其策略而获得更高收益。形式化地,策略组合 s=(s1,s2,,sn)s^* = (s_1^*, s_2^*, \ldots, s_n^*) 构成纳什均衡当且仅当:

ui(si,si)ui(si,si),siSi,iu_i(s_i^*, s_{-i}^*) \geq u_i(s_i, s_{-i}^*), \quad \forall s_i \in S_i, \quad \forall i

其中 uiu_i 为参与人 ii效用函数sis_{-i}^* 表示除 ii 外所有参与人的均衡策略。纳什均衡的吸引力在于其自我执行性(Self-Enforcing):若所有参与人均预期该均衡将被执行,则无人有动机偏离。

应用与扩展

策略概念在经济学中的应用远超出传统博弈论范畴。在产业组织理论中,企业策略涵盖定价(伯特兰模型古诺模型)、产能投资(斯塔克尔伯格模型)、产品差异化、研发竞赛以及进入威慑等。在拍卖理论中,竞标策略(Bidding Strategy)决定竞标者在一级密封拍卖维克里拍卖等不同拍卖形式下的最优出价规则。在宏观经济学中,货币政策的时间不一致性问题由Kydland与Prescott以策略博弈框架分析,揭示了承诺策略(Commitment)与相机抉择策略(Discretion)之间的根本张力。

演化博弈论进一步扩展了策略概念,将策略视为群体中的行为类型(Behavioral Type),通过复制者动态(Replicator Dynamics)研究策略频率的演化,并引入演化稳定策略(Evolutionarily Stable Strategy, ESS)概念,该策略一旦被群体多数采用,便能抵抗小规模突变类型的入侵。在委托-代理理论机制设计中,策略构成激励相容约束的基础:委托人设计的机制必须使代理人的最优策略是如实报告其私人信息或采取委托人期望的行动,从而使策略分析成为契约理论与信息经济学的核心工具。

策略概念的深刻性在于它将经济主体的决策从孤立的优化问题转化为相互依赖的推理过程。理解策略不仅是学习博弈论的技术起点,更是深入领会现代经济学中战略互动逻辑的门径。