ARTICLE

mixed strategies

混合策略(Mixed Strategy)是指博弈论中参与者在策略集中以某一概率分布随机化选择行动的策略概念。与纯策略(pure strategy)明确指定每种情形下的确定性行动不同,混合策略允许参与者通过随机化来应对对手的不确定性、掩盖自身的行动意图,或在不存在纯策略纳什均衡的博弈中获得均衡存在性。混合策略是纳什(Nash, 1950)在其开创性论文中证明"

浏览 0 更新 2026-05-26

混合策略(Mixed Strategy)是指博弈论中参与者在策略集中以某一概率分布随机化选择行动的策略概念。与纯策略(pure strategy)明确指定每种情形下的确定性行动不同,混合策略允许参与者通过随机化来应对对手的不确定性、掩盖自身的行动意图,或在不存在纯策略纳什均衡的博弈中获得均衡存在性。混合策略是纳什(Nash, 1950)在其开创性论文中证明"任何有限博弈都存在纳什均衡"这一里程碑结论的核心工具,是现代博弈论的基础性概念之一。在应用层面,混合策略在经济学、政治学、进化生物学和计算机科学等领域广泛用于建模随机性、不确定性和不可预测性行为。

形式化定义

设参与者 i i 的纯策略集为 Si={si1,si2,,sim} S_i = \{s_{i1}, s_{i2}, \dots, s_{im}\} 。参与者 i i 的一个混合策略 σi \sigma_i 是定义在 Si S_i 上的一个概率分布,即 σi=(σi(si1),,σi(sim)) \sigma_i = (\sigma_i(s_{i1}), \dots, \sigma_i(s_{im})) ,其中 σi(sij)0 \sigma_i(s_{ij}) \geq 0 j=1mσi(sij)=1 \sum_{j=1}^m \sigma_i(s_{ij}) = 1 。混合策略的全体构成一个 (m1) (m-1) 维单纯形,记作 Δ(Si) \Delta(S_i) 。纯策略是混合策略的特例——将全部概率质量集中于单一纯策略的退化分布。当所有参与者均选择了各自的混合策略后,联合概率分布 σ=(σ1,,σn) \sigma = (\sigma_1, \dots, \sigma_n) 诱导出各策略组合发生的概率,参与者的期望收益即为各纯策略组合下收益的加权平均值:ui(σ)=sS(j=1nσj(sj))ui(s) u_i(\sigma) = \sum_{s \in S} \left( \prod_{j=1}^n \sigma_j(s_j) \right) u_i(s) 。混合策略的组合 σ=(σ1,,σn) \sigma^* = (\sigma_1^*, \dots, \sigma_n^*) 构成一个混合策略纳什均衡(Mixed Strategy Nash Equilibrium, MSNE),当且仅当对任意参与者 i i 及其任意混合策略 σiΔ(Si) \sigma_i' \in \Delta(S_i) ,有 ui(σi,σi)ui(σi,σi) u_i(\sigma_i^*, \sigma_{-i}^*) \geq u_i(\sigma_i', \sigma_{-i}^*) 。换言之,在均衡状态下,每个参与者的混合策略都是对他人混合策略的最优反应。

混合策略的核心性质

混合策略纳什均衡具有几个重要的识别性质。其一是无差异条件(Indifference Principle):在均衡中,如果参与者 i i 以正概率选择两个或多个纯策略(即这些纯策略位于混合策略的支撑集中),则这些纯策略在对手均衡策略下的期望收益必须相等。反之,任何以严格劣策略参与的纯策略不可能被赋予正概率。这一条件为求解混合策略均衡提供了基本方法:通过令对手的策略使己方在某几个纯策略间无差异,从而解出对手的混合概率。其二是均衡的存在性与通用性:纳什定理确保任何有限博弈(有限参与者、有限纯策略集)都存在至少一个混合策略纳什均衡。对于无限博弈或连续行动空间,在适当的凸性和连续性条件下同样存在混合策略均衡。其三是混合策略与纯策略的关系:在大多数常见的无协调问题的博弈中,混合策略均衡的期望收益往往低于帕累托最优的纯策略均衡收益,这解释了为何参与者在有机会预先沟通时通常偏好使用纯策略或相关策略。

经典例子:猜硬币博弈

猜硬币博弈(Matching Pennies)是理解混合策略的最简洁模型。两名参与者同时选择正面或反面:若两人选择一致(同正或同反),参与者1赢得1美元,参与者2输掉1美元;若选择不同,则参与者2赢、参与者1输。该博弈不存在纯策略纳什均衡,因为任何确定性策略都会被对手针对性地利用。设参与者1以概率 p p 选正面、参与者2以概率 q q 选正面,则参与者1的期望收益为 pq×1+p(1q)×(1)+(1p)q×(1)+(1p)(1q)×1=(2p1)(2q1) pq \times 1 + p(1-q) \times (-1) + (1-p)q \times (-1) + (1-p)(1-q) \times 1 = (2p-1)(2q-1) 。令 p p 使参与者2无差异解得 q=1/2 q=1/2 ;对称地,令 q q 使参与者1无差异解得 p=1/2 p=1/2 。因此唯一的混合策略纳什均衡是双方各以 1/2 1/2 概率随机选择正面——任何偏离此概率的行为都会使对手获得可乘之机。这一均衡的直观含义是:在对抗性零和博弈中,参与者必须完全不可预测,任何可被对手识别的模式化行为都将被加以利用。

混合策略的解释与争论

混合策略在理论上优雅,但在实证和概念层面引发了长期讨论。主要存在三种解释路径。客观随机化解释认为参与者在实际决策中确实使用随机装置(掷骰子、计算机随机数生成器)来选择行动,这常见于体育比赛中的发球选择、扑克游戏中的诈唬策略等场景。主观信念解释(或称为"纯策略均衡的不确定性解释")由海萨尼(Harsanyi, 1973)的纯化定理(Purification Theorem)支撑:混合策略均衡可以被视为一个不完全信息博弈中纯策略贝叶斯纳什均衡的极限——当支付扰动趋于零时,每个参与者的纯策略依赖于其私人观测到的微小随机因素,而在全局分布上呈现出混合策略的统计特征。群体解释认为混合策略并不描述单个参与者的随机化行为,而是描述一个群体中各成员选择不同纯策略的比例分布。这三种解释各有适用范围,但纯化定理在理论层面最为深刻:它表明混合策略均衡并不依赖于参与者实际具备随机化能力,而可以从不完全信息下的纯策略行为中涌现出来。

混合策略的应用

混合策略在多个学科中具有丰富的应用。在产业组织中,Varian(1980)的"销售模型"用混合策略均衡解释零售商为何随机地提供折扣,从而在消费者之间形成价格离散。在进化生物学中,鹰鸽博弈(Hawk-Dove Game)的混合策略均衡对应于种群中攻击型个体与和平型个体的稳定比例,Maynard Smith将此称为进化稳定策略(ESS)的混合策略形式。在政治学中,竞选双方的议题选择和广告投放策略常呈现混合策略特征:随机化使对手无法预测己方的资源分配重点。在计算机科学中,网络安全中的入侵检测博弈、云计算中的资源配置博弈等广泛使用混合策略来建模攻防双方的不确定性。在实验经济学中,诸多实验室实验证实参与者在零和博弈中大致遵循混合策略均衡预测的比例,但在协调博弈和合作类博弈中偏离更为显著。总体而言,混合策略既是博弈论理论大厦的基石——保证了纳什均衡的普遍存在性——也是连接完全理性博弈与不确定性现实世界的关键桥梁,其理论深度和应用广度使其成为每个博弈论研究者必须掌握的基础概念。

参考文献

  1. Nash, J. (1950). Equilibrium points in n n -person games. *Proceedings of the National Academy of Sciences*, 36(1), 48–49.
  2. Harsanyi, J. C. (1973). Games with randomly disturbed payoffs: A new rationale for mixed-strategy equilibrium points. *International Journal of Game Theory*, 2(1), 1–23.
  3. Varian, H. R. (1980). A model of sales. *The American Economic Review*, 70(4), 651–659.
  4. Maynard Smith, J. (1982). *Evolution and the Theory of Games*. Cambridge University Press.
  5. Osborne, M. J., \& Rubinstein, A. (1994). *A Course in Game Theory*. MIT Press.
  6. Fudenberg, D., \& Tirole, J. (1991). *Game Theory*. MIT Press.