ARTICLE

智猪博弈

智猪博弈 (Boxed Pig Game) 智猪博弈（Boxed Pig Game）是博弈论中一个经典的非合作完全信息静态博弈模型，由John McMillan与张维迎等学者广泛引介，用于阐释理性搭便车与多劳不多得的经济直觉。模型刻画一大一小两只猪同处一个猪圈：猪圈一端设有食槽，另一端设有一个踏板；踩下踏板需付出劳动成本，食槽则在猪圈另一侧释放固定量的食物。

浏览 2 更新 2025-10-29

智猪博弈 (Boxed Pig Game)

智猪博弈（Boxed Pig Game）是博弈论中一个经典的非合作完全信息静态博弈模型，由John McMillan与张维迎等学者广泛引介，用于阐释理性搭便车与多劳不多得的经济直觉。模型刻画一大一小两只猪同处一个猪圈：猪圈一端设有食槽，另一端设有一个踏板；踩下踏板需付出劳动成本，食槽则在猪圈另一侧释放固定量的食物。大猪凭借体型优势能在食物释放后挤开小猪优先取食，小猪则只能在剩余中进食。该博弈的纳什均衡揭示了一个反直觉的结论——弱者等待、强者劳动——在完全理性假设下，小猪将选择不做贡献而坐享其成，大猪虽不满却不得不承担全部劳动。

模型设定

设猪圈内有大猪（Player B）和小猪（Player S）。踩一次踏板释放 $Q$ 单位食物，猪需从踏板一端跑至食槽一端才能进食。踩踏板者承担劳动成本 $c > 0$ （包含体力消耗与先发的时间劣势）。两只猪的行动空间均为 $\{\text{踩}, \text{等}\}$ 。关键在于食物分配规则：

若大猪先到槽边，大猪吃到 $a_B$ 单位，小猪吃到 $a_S$ 单位， $a_B > a_S$ 且 $a_B + a_S = Q$ ；
若小猪先到，大猪随后赶到仍可挤开小猪，故大猪仍能吃到 $b_B$ ，小猪吃到 $b_S$ ， $b_B > b_S$ 且 $b_B + b_S = Q$ ；
若两只猪同时到达，大猪凭借体型优势吃到 $\tilde{a}_B$ ，小猪吃到 $\tilde{a}_S$ ， $\tilde{a}_B > \tilde{a}_S$ 。

记踩踏板者为谁决定了谁先跑到食槽一端：踩踏板者因在踏板处耗费时间而后到食槽，等待者反而先到。因此，等待者实质上获得了先发优势。以具体参数为例（张维迎的经典参数化）： $Q = 10$ ， $c = 2$ 。若大猪踩、小猪等，大猪后到，小猪先到吃掉 $4$ ，大猪随后赶到吃掉剩余的 $6$ ，大猪净收益 $6 - 2 = 4$ ，小猪净收益 $4$ 。若小猪踩、大猪等，小猪后到，大猪先到吃掉 $9$ ，小猪吃到 $1$ ，净收益 $-1$ ，大猪净收益 $9$ 。若同时踩，同时到，大猪吃 $7$ ，小猪吃 $3$ ，分别净得 $5$ 和 $1$ 。若都等，均得 $0$ 。

优势策略分析

将上述参数化的收益结构整理为如下标准式博弈（Normal Form）：

\begin{tabular}{c|cc} \& 小猪踩 \& 小猪等 \\ \hline 大猪踩 \& $(5, 1)$ \& $(4, 4)$ \\ 大猪等 \& $(9, -1)$ \& $(0, 0)$ \\ \end{tabular}

对大猪而言，不存在严格优势策略：当小猪踩时大猪等得 $9 > 5$ ，当小猪等时大猪踩得 $4 > 0$ ，最优行动取决于小猪的选择。然而对小猪而言，"等"严格占优"踩"：无论大猪选择何种行动，小猪等所得收益均严格大于踩（ $4 > 1$ ， $0 > -1$ ）。理性的小猪因此绝对不会踩踏板。

大猪预见到小猪的这一占优策略后，只能在"小猪等"的一列中做选择：踩得 $4$ ，等得 $0$ ，故大猪的最优反应是踩踏板。由此得到该博弈的严格优势策略均衡：大猪踩、小猪等。

纳什均衡与重复博弈含义

上述纯策略组合（踩, 等）是博弈唯一的纳什均衡：给定大猪踩踏板，小猪的最优反应是等（ $4 > 1$ ）；给定小猪等，大猪的最优反应是踩（ $4 > 0$ ）。双方均无单方面偏离的动机。

在重复博弈情境中，若智猪博弈无限重复，大猪虽在每个阶段收益不及小猪（ $4 < 4$ ——注意此处两者相等），但均衡结果不会因重复而改变：小猪搭便车的占优策略性质在每一期均成立。然而，若引入退出选项——大猪可以选择离开猪圈另觅食物——则均衡条件将发生变化。大猪的参与约束要求其收益不低于外部机会，否则博弈崩溃，双方同归于零。这为分析雇佣关系、联盟博弈中的权力结构提供了洞见。

经济含义与经典应用

智猪博弈的核心洞察在于：当公共品供给存在参与成本且收益分配不对称时，弱势方有激励放弃贡献、等待强势方提供公共品。这一逻辑在经济学诸多场景中得到了广泛应用：

公共品供给与国际关系：大国家承担更多国际公共品（如全球气候治理、国际金融稳定、自由贸易体系维护）的供给成本，而小国家搭便车享受。Olson（1965）在《集体行动的逻辑》中提出的"小国剥削大国"命题，本质上是智猪博弈在集体行动领域的先驱阐述。北约防务分担中，美国承担不成比例的军费开支，其他成员国倾向低投入，正是智猪博弈的结构。

产业组织与企业战略：大企业投入巨资进行研发创新和市场培育，中小企业模仿和跟随。大企业承担开拓市场的沉没成本，中小企业在大企业打开市场后进入，享受外溢效应。品牌领先者投入广告费维持品类认知，跟随者获益于品类整体的需求扩张。这不仅是大企业的社会责任论争之博弈论基础，也解释了为何在专利保护薄弱的环境中追随战略广泛存在。

组织内部激励：团队生产中，能力强的成员往往承担不成比例的工作量（"能者多劳"），而能力弱者选择偷懒。若薪酬与团队产出挂钩且无法精确区分个体贡献，则强者形同大猪。企业改革中的"鞭打快牛"现象便可在此框架下理解。

制度改革：智猪博弈常被引用为产权明晰化与激励制度改革的理论依据。若将"按劳分配"改为"多劳多得"——例如踩踏板者拥有优先取食权或独占权——则小猪的占优策略消失，双方均有动力贡献。这为从"大锅饭"向市场化激励机制的转型提供了博弈论注脚。

与相关博弈的比较

智猪博弈与斗鸡博弈（Chicken Game）及囚徒困境存在结构性差异。囚徒困境中背叛严格占优合作，导致帕累托次优均衡；而智猪博弈中小猪的等待占优却导向了一个帕累托有效的结果（不存在双方同时改善的余地，因为使大猪更好必然损害小猪）。斗鸡博弈有两个不对称的纯策略纳什均衡（一方进一方退），而智猪博弈仅有一个纯策略均衡，其不对称性内生于体型/能力差异。

与猎鹿博弈（Stag Hunt）相比，智猪博弈不涉及风险占优与收益占优的张力——其均衡由严格的占优逻辑驱动，协调失败不是问题。这一特征使其在建模"结构性不平等"时比对称博弈更具解释力。

行为实验证据

实验室证据对智猪博弈的预测提供了部分支持。在单次匿名实验中，约 $60\%\text{--}70\%$ 的小猪被试选择等待，与占优策略的预测方向一致；大猪被试踩踏板的比率高于随机水平但常低于理论预测的 $100\%$ ，部分大猪选择"以牙还牙"式的等待以惩罚搭便车者。重复互动实验中，大猪偶尔通过一开始等待来试图"训练"小猪踩踏板，但通常以双方收益归零告终，最终回归非对称均衡。这些偏离表明社会偏好（如不平等厌恶、互惠动机）在单次互动中显著，但长期学习效应推动结果向纳什均衡收敛。

数学推广

智猪博弈可推广为一般形式的不对称公共品博弈。令大猪与小猪的收益函数分别为：

U_B(x_B, x_S) = f_B(x_B + x_S) - c_B x_B, \quad U_S(x_B, x_S) = f_S(x_B + x_S) - c_S x_S

其中 $x_i \in \{0, 1\}$ 为是否贡献的二分决策， $f_i$ 为个体 $i$ 从公共品总量中分得的份额，满足 $f_B$ 的边际收益大于 $f_S$ 。零贡献是小猪的占优策略的条件为 $f_S(1) - f_S(0) < c_S$ ：即公共品的边际私人收益低于贡献的私人成本。此时大猪的最优反应取决于 $f_B(1) - f_B(0) > c_B$ 是否成立——若成立则大猪选择贡献，博弈退化为单边供给均衡。此形式连接了智猪博弈与公共经济学中自愿贡献机制（Voluntary Contribution Mechanism）的一般理论。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。