ARTICLE

智猪博弈

智猪博弈 (Boxed Pig Game) 智猪博弈(Boxed Pig Game)是博弈论中一个经典的非合作完全信息静态博弈模型,由John McMillan与张维迎等学者广泛引介,用于阐释理性搭便车与多劳不多得的经济直觉。模型刻画一大一小两只猪同处一个猪圈:猪圈一端设有食槽,另一端设有一个踏板;踩下踏板需付出劳动成本,食槽则在猪圈另一侧释放固定量的食物。

浏览 2 更新 2025-10-29

智猪博弈 (Boxed Pig Game)

智猪博弈(Boxed Pig Game)是博弈论中一个经典的非合作完全信息静态博弈模型,由John McMillan张维迎等学者广泛引介,用于阐释理性搭便车多劳不多得的经济直觉。模型刻画一大一小两只猪同处一个猪圈:猪圈一端设有食槽,另一端设有一个踏板;踩下踏板需付出劳动成本,食槽则在猪圈另一侧释放固定量的食物。大猪凭借体型优势能在食物释放后挤开小猪优先取食,小猪则只能在剩余中进食。该博弈的纳什均衡揭示了一个反直觉的结论——弱者等待、强者劳动——在完全理性假设下,小猪将选择不做贡献而坐享其成,大猪虽不满却不得不承担全部劳动。

模型设定

设猪圈内有大猪(Player B)和小猪(Player S)。踩一次踏板释放 QQ 单位食物,猪需从踏板一端跑至食槽一端才能进食。踩踏板者承担劳动成本 c>0c > 0(包含体力消耗与先发的时间劣势)。两只猪的行动空间均为 {,}\{\text{踩}, \text{等}\}。关键在于食物分配规则

  • 若大猪先到槽边,大猪吃到 aBa_B 单位,小猪吃到 aSa_S 单位,aB>aSa_B > a_SaB+aS=Qa_B + a_S = Q
  • 若小猪先到,大猪随后赶到仍可挤开小猪,故大猪仍能吃到 bBb_B,小猪吃到 bSb_SbB>bSb_B > b_SbB+bS=Qb_B + b_S = Q
  • 若两只猪同时到达,大猪凭借体型优势吃到 a~B\tilde{a}_B,小猪吃到 a~S\tilde{a}_Sa~B>a~S\tilde{a}_B > \tilde{a}_S

记踩踏板者为谁决定了谁先跑到食槽一端:踩踏板者因在踏板处耗费时间而后到食槽,等待者反而先到。因此,等待者实质上获得了先发优势。以具体参数为例(张维迎的经典参数化):Q=10Q = 10c=2c = 2。若大猪踩、小猪等,大猪后到,小猪先到吃掉 44,大猪随后赶到吃掉剩余的 66,大猪净收益 62=46 - 2 = 4,小猪净收益 44。若小猪踩、大猪等,小猪后到,大猪先到吃掉 99,小猪吃到 11,净收益 1-1,大猪净收益 99。若同时踩,同时到,大猪吃 77,小猪吃 33,分别净得 5511。若都等,均得 00

优势策略分析

将上述参数化的收益结构整理为如下标准式博弈(Normal Form):

\begin{tabular}{c|cc} \& 小猪踩 \& 小猪等 \\ \hline 大猪踩 \& (5,1)(5, 1) \& (4,4)(4, 4) \\ 大猪等 \& (9,1)(9, -1) \& (0,0)(0, 0) \\ \end{tabular}

对大猪而言,不存在严格优势策略:当小猪踩时大猪等得 9>59 > 5,当小猪等时大猪踩得 4>04 > 0,最优行动取决于小猪的选择。然而对小猪而言,"等"严格占优"踩":无论大猪选择何种行动,小猪等所得收益均严格大于踩(4>14 > 10>10 > -1)。理性的小猪因此绝对不会踩踏板。

大猪预见到小猪的这一占优策略后,只能在"小猪等"的一列中做选择:踩得 44,等得 00,故大猪的最优反应是踩踏板。由此得到该博弈的严格优势策略均衡:大猪踩、小猪等。

纳什均衡与重复博弈含义

上述纯策略组合(踩, 等)是博弈唯一的纳什均衡:给定大猪踩踏板,小猪的最优反应是等(4>14 > 1);给定小猪等,大猪的最优反应是踩(4>04 > 0)。双方均无单方面偏离的动机。

重复博弈情境中,若智猪博弈无限重复,大猪虽在每个阶段收益不及小猪(4<44 < 4——注意此处两者相等),但均衡结果不会因重复而改变:小猪搭便车的占优策略性质在每一期均成立。然而,若引入退出选项——大猪可以选择离开猪圈另觅食物——则均衡条件将发生变化。大猪的参与约束要求其收益不低于外部机会,否则博弈崩溃,双方同归于零。这为分析雇佣关系、联盟博弈中的权力结构提供了洞见。

经济含义与经典应用

智猪博弈的核心洞察在于:当公共品供给存在参与成本且收益分配不对称时,弱势方有激励放弃贡献、等待强势方提供公共品。这一逻辑在经济学诸多场景中得到了广泛应用:

公共品供给与国际关系:大国家承担更多国际公共品(如全球气候治理、国际金融稳定、自由贸易体系维护)的供给成本,而小国家搭便车享受。Olson(1965)在《集体行动的逻辑》中提出的"小国剥削大国"命题,本质上是智猪博弈在集体行动领域的先驱阐述。北约防务分担中,美国承担不成比例的军费开支,其他成员国倾向低投入,正是智猪博弈的结构。

产业组织与企业战略:大企业投入巨资进行研发创新和市场培育,中小企业模仿和跟随。大企业承担开拓市场的沉没成本,中小企业在大企业打开市场后进入,享受外溢效应。品牌领先者投入广告费维持品类认知,跟随者获益于品类整体的需求扩张。这不仅是大企业的社会责任论争之博弈论基础,也解释了为何在专利保护薄弱的环境中追随战略广泛存在。

组织内部激励:团队生产中,能力强的成员往往承担不成比例的工作量("能者多劳"),而能力弱者选择偷懒。若薪酬与团队产出挂钩且无法精确区分个体贡献,则强者形同大猪。企业改革中的"鞭打快牛"现象便可在此框架下理解。

制度改革:智猪博弈常被引用为产权明晰化与激励制度改革的理论依据。若将"按劳分配"改为"多劳多得"——例如踩踏板者拥有优先取食权或独占权——则小猪的占优策略消失,双方均有动力贡献。这为从"大锅饭"向市场化激励机制的转型提供了博弈论注脚。

与相关博弈的比较

智猪博弈与斗鸡博弈(Chicken Game)及囚徒困境存在结构性差异。囚徒困境中背叛严格占优合作,导致帕累托次优均衡;而智猪博弈中小猪的等待占优却导向了一个帕累托有效的结果(不存在双方同时改善的余地,因为使大猪更好必然损害小猪)。斗鸡博弈有两个不对称的纯策略纳什均衡(一方进一方退),而智猪博弈仅有一个纯策略均衡,其不对称性内生于体型/能力差异。

猎鹿博弈(Stag Hunt)相比,智猪博弈不涉及风险占优收益占优的张力——其均衡由严格的占优逻辑驱动,协调失败不是问题。这一特征使其在建模"结构性不平等"时比对称博弈更具解释力。

行为实验证据

实验室证据对智猪博弈的预测提供了部分支持。在单次匿名实验中,约 60%70%60\%\text{--}70\% 的小猪被试选择等待,与占优策略的预测方向一致;大猪被试踩踏板的比率高于随机水平但常低于理论预测的 100%100\%,部分大猪选择"以牙还牙"式的等待以惩罚搭便车者。重复互动实验中,大猪偶尔通过一开始等待来试图"训练"小猪踩踏板,但通常以双方收益归零告终,最终回归非对称均衡。这些偏离表明社会偏好(如不平等厌恶互惠动机)在单次互动中显著,但长期学习效应推动结果向纳什均衡收敛。

数学推广

智猪博弈可推广为一般形式的不对称公共品博弈。令大猪与小猪的收益函数分别为:

UB(xB,xS)=fB(xB+xS)cBxB,US(xB,xS)=fS(xB+xS)cSxSU_B(x_B, x_S) = f_B(x_B + x_S) - c_B x_B, \quad U_S(x_B, x_S) = f_S(x_B + x_S) - c_S x_S

其中 xi{0,1}x_i \in \{0, 1\} 为是否贡献的二分决策,fif_i 为个体 ii 从公共品总量中分得的份额,满足 fBf_B 的边际收益大于 fSf_S。零贡献是小猪的占优策略的条件为 fS(1)fS(0)<cSf_S(1) - f_S(0) < c_S:即公共品的边际私人收益低于贡献的私人成本。此时大猪的最优反应取决于 fB(1)fB(0)>cBf_B(1) - f_B(0) > c_B 是否成立——若成立则大猪选择贡献,博弈退化为单边供给均衡。此形式连接了智猪博弈与公共经济学自愿贡献机制(Voluntary Contribution Mechanism)的一般理论。