ARTICLE
智猪博弈
智猪博弈 (Boxed Pig Game) 智猪博弈(Boxed Pig Game)是博弈论中一个经典的非合作完全信息静态博弈模型,由John McMillan与张维迎等学者广泛引介,用于阐释理性搭便车与多劳不多得的经济直觉。模型刻画一大一小两只猪同处一个猪圈:猪圈一端设有食槽,另一端设有一个踏板;踩下踏板需付出劳动成本,食槽则在猪圈另一侧释放固定量的食物。
智猪博弈 (Boxed Pig Game)
智猪博弈(Boxed Pig Game)是博弈论中一个经典的非合作完全信息静态博弈模型,由John McMillan与张维迎等学者广泛引介,用于阐释理性搭便车与多劳不多得的经济直觉。模型刻画一大一小两只猪同处一个猪圈:猪圈一端设有食槽,另一端设有一个踏板;踩下踏板需付出劳动成本,食槽则在猪圈另一侧释放固定量的食物。大猪凭借体型优势能在食物释放后挤开小猪优先取食,小猪则只能在剩余中进食。该博弈的纳什均衡揭示了一个反直觉的结论——弱者等待、强者劳动——在完全理性假设下,小猪将选择不做贡献而坐享其成,大猪虽不满却不得不承担全部劳动。
模型设定
设猪圈内有大猪(Player B)和小猪(Player S)。踩一次踏板释放 单位食物,猪需从踏板一端跑至食槽一端才能进食。踩踏板者承担劳动成本 (包含体力消耗与先发的时间劣势)。两只猪的行动空间均为 。关键在于食物分配规则:
- 若大猪先到槽边,大猪吃到 单位,小猪吃到 单位, 且 ;
- 若小猪先到,大猪随后赶到仍可挤开小猪,故大猪仍能吃到 ,小猪吃到 , 且 ;
- 若两只猪同时到达,大猪凭借体型优势吃到 ,小猪吃到 ,。
记踩踏板者为谁决定了谁先跑到食槽一端:踩踏板者因在踏板处耗费时间而后到食槽,等待者反而先到。因此,等待者实质上获得了先发优势。以具体参数为例(张维迎的经典参数化):,。若大猪踩、小猪等,大猪后到,小猪先到吃掉 ,大猪随后赶到吃掉剩余的 ,大猪净收益 ,小猪净收益 。若小猪踩、大猪等,小猪后到,大猪先到吃掉 ,小猪吃到 ,净收益 ,大猪净收益 。若同时踩,同时到,大猪吃 ,小猪吃 ,分别净得 和 。若都等,均得 。
优势策略分析
将上述参数化的收益结构整理为如下标准式博弈(Normal Form):
\begin{tabular}{c|cc} \& 小猪踩 \& 小猪等 \\ \hline 大猪踩 \& \& \\ 大猪等 \& \& \\ \end{tabular}
对大猪而言,不存在严格优势策略:当小猪踩时大猪等得 ,当小猪等时大猪踩得 ,最优行动取决于小猪的选择。然而对小猪而言,"等"严格占优"踩":无论大猪选择何种行动,小猪等所得收益均严格大于踩(,)。理性的小猪因此绝对不会踩踏板。
大猪预见到小猪的这一占优策略后,只能在"小猪等"的一列中做选择:踩得 ,等得 ,故大猪的最优反应是踩踏板。由此得到该博弈的严格优势策略均衡:大猪踩、小猪等。
纳什均衡与重复博弈含义
上述纯策略组合(踩, 等)是博弈唯一的纳什均衡:给定大猪踩踏板,小猪的最优反应是等();给定小猪等,大猪的最优反应是踩()。双方均无单方面偏离的动机。
在重复博弈情境中,若智猪博弈无限重复,大猪虽在每个阶段收益不及小猪(——注意此处两者相等),但均衡结果不会因重复而改变:小猪搭便车的占优策略性质在每一期均成立。然而,若引入退出选项——大猪可以选择离开猪圈另觅食物——则均衡条件将发生变化。大猪的参与约束要求其收益不低于外部机会,否则博弈崩溃,双方同归于零。这为分析雇佣关系、联盟博弈中的权力结构提供了洞见。
经济含义与经典应用
智猪博弈的核心洞察在于:当公共品供给存在参与成本且收益分配不对称时,弱势方有激励放弃贡献、等待强势方提供公共品。这一逻辑在经济学诸多场景中得到了广泛应用:
公共品供给与国际关系:大国家承担更多国际公共品(如全球气候治理、国际金融稳定、自由贸易体系维护)的供给成本,而小国家搭便车享受。Olson(1965)在《集体行动的逻辑》中提出的"小国剥削大国"命题,本质上是智猪博弈在集体行动领域的先驱阐述。北约防务分担中,美国承担不成比例的军费开支,其他成员国倾向低投入,正是智猪博弈的结构。
产业组织与企业战略:大企业投入巨资进行研发创新和市场培育,中小企业模仿和跟随。大企业承担开拓市场的沉没成本,中小企业在大企业打开市场后进入,享受外溢效应。品牌领先者投入广告费维持品类认知,跟随者获益于品类整体的需求扩张。这不仅是大企业的社会责任论争之博弈论基础,也解释了为何在专利保护薄弱的环境中追随战略广泛存在。
组织内部激励:团队生产中,能力强的成员往往承担不成比例的工作量("能者多劳"),而能力弱者选择偷懒。若薪酬与团队产出挂钩且无法精确区分个体贡献,则强者形同大猪。企业改革中的"鞭打快牛"现象便可在此框架下理解。
制度改革:智猪博弈常被引用为产权明晰化与激励制度改革的理论依据。若将"按劳分配"改为"多劳多得"——例如踩踏板者拥有优先取食权或独占权——则小猪的占优策略消失,双方均有动力贡献。这为从"大锅饭"向市场化激励机制的转型提供了博弈论注脚。
与相关博弈的比较
智猪博弈与斗鸡博弈(Chicken Game)及囚徒困境存在结构性差异。囚徒困境中背叛严格占优合作,导致帕累托次优均衡;而智猪博弈中小猪的等待占优却导向了一个帕累托有效的结果(不存在双方同时改善的余地,因为使大猪更好必然损害小猪)。斗鸡博弈有两个不对称的纯策略纳什均衡(一方进一方退),而智猪博弈仅有一个纯策略均衡,其不对称性内生于体型/能力差异。
与猎鹿博弈(Stag Hunt)相比,智猪博弈不涉及风险占优与收益占优的张力——其均衡由严格的占优逻辑驱动,协调失败不是问题。这一特征使其在建模"结构性不平等"时比对称博弈更具解释力。
行为实验证据
实验室证据对智猪博弈的预测提供了部分支持。在单次匿名实验中,约 的小猪被试选择等待,与占优策略的预测方向一致;大猪被试踩踏板的比率高于随机水平但常低于理论预测的 ,部分大猪选择"以牙还牙"式的等待以惩罚搭便车者。重复互动实验中,大猪偶尔通过一开始等待来试图"训练"小猪踩踏板,但通常以双方收益归零告终,最终回归非对称均衡。这些偏离表明社会偏好(如不平等厌恶、互惠动机)在单次互动中显著,但长期学习效应推动结果向纳什均衡收敛。
数学推广
智猪博弈可推广为一般形式的不对称公共品博弈。令大猪与小猪的收益函数分别为:
其中 为是否贡献的二分决策, 为个体 从公共品总量中分得的份额,满足 的边际收益大于 。零贡献是小猪的占优策略的条件为 :即公共品的边际私人收益低于贡献的私人成本。此时大猪的最优反应取决于 是否成立——若成立则大猪选择贡献,博弈退化为单边供给均衡。此形式连接了智猪博弈与公共经济学中自愿贡献机制(Voluntary Contribution Mechanism)的一般理论。