ARTICLE

收益 (Payoff)

收益 (Payoff) 收益（Payoff）是博弈论和决策理论中的核心概念，指参与人在给定策略组合下所获得的效用、利润或其他量化回报。在博弈的数学模型中，收益是参与人选择策略的根本动机，也是纳什均衡等解概念的基础。每个参与人的收益不仅取决于自身的策略选择，还取决于其他参与人的策略选择，由此构成了博弈策略互动的基本特征。收益概念最早可追溯至冯·诺依曼（Joh

浏览 0 更新 2025-10-26

收益 (Payoff)

收益（Payoff）是博弈论和决策理论中的核心概念，指参与人在给定策略组合下所获得的效用、利润或其他量化回报。在博弈的数学模型中，收益是参与人选择策略的根本动机，也是纳什均衡等解概念的基础。每个参与人的收益不仅取决于自身的策略选择，还取决于其他参与人的策略选择，由此构成了博弈策略互动的基本特征。

收益概念最早可追溯至冯·诺依曼（John von Neumann）和摩根斯坦（Oskar Morgenstern）于1944年出版的《博弈论与经济行为》。他们利用效用函数（Utility Function）将参与人在不同结果下的偏好量化为实数，为博弈的数学化分析奠定了基础。在博弈论的标准形式中，收益通常用实数表示——数值越大，代表该结果对该参与人越有利。

收益的表征形式

收益在不同的博弈表示形式中有不同的呈现方式。在标准式博弈（Normal-form Game）中，所有参与人同时选择策略，收益用一个多维矩阵或函数表示。对于一个有 $n$ 个参与人的博弈，参与人 $i$ 的收益函数一般写作 $u_i: S_1 \times S_2 \times \cdots \times S_n \to \mathbb{R}$ ，其中 $S_i$ 是参与人 $i$ 的策略集。在两人有限博弈中，收益矩阵是最常见的表示法：行代表参与人1的策略，列代表参与人2的策略，单元格中的有序数对 $(a, b)$ 分别表示参与人1和参与人2的收益。

在扩展式博弈（Extensive-form Game）中，收益位于博弈树的终端节点（叶子节点）处。当博弈通过博弈树（Game Tree）的形式展现时，每个决策节点代表参与人的一个选择回合，而终端节点标明了所有参与人在该路径下的最终收益。这种表示方式特别适合描述序贯博弈（Sequential Game），例如完全信息博弈中的动态策略互动。

《博弈论与经济行为》一书中同时区分了零和博弈（Zero-sum Game）与非零和博弈（Non-zero-sum Game）。在零和博弈中，所有参与人的收益之和为零，一方的所得恰为另一方的所失。这一性质使零和博弈在混合策略纳什均衡和最小最大定理（Minimax Theorem）的分析中具有特殊地位。

收益与偏好

收益与偏好（Preference）之间存在密切的逻辑联系。参与人之所以在博弈中选择某种策略，是因为该策略带来更高的收益——而收益的高低本质上反映了参与人对不同结果的偏好排序。在期望效用理论（Expected Utility Theory）框架下，参与人的收益可以被理解为效用函数在特定结果上的取值。

偏好关系 $\succsim$ 必须满足完备性（Completeness）和传递性（Transitivity）等理性公理，才能被表示为一个实数值效用函数 $u$ 。如果偏好同时满足独立性公理（Independence Axiom）和连续性公理（Continuity Axiom），则在不确定性情境下，偏好可以由冯·诺依曼-摩根斯坦效用函数（Von Neumann-Morgenstern Utility Function）表示，此时参与人最大化的是期望收益。

值得注意的是，收益可以反映不同的参与人动机。在自私理性（Rational Self-interest）假设下，参与人只关心自身的收益。但在一些博弈情境中，参与人可能还关心公平（Fairness）、利他主义（Altruism）或互惠（Reciprocity），这些因素可以通过修正收益函数来纳入模型。例如在最后通牒博弈（Ultimatum Game）和独裁者博弈（Dictator Game）中，实验发现参与人的实际行为常常偏离纯自利的预测，促使经济学家引入社会偏好（Social Preferences）来调整收益函数。

收益在解概念中的作用

收益函数在博弈解概念中起着决定性作用。纳什均衡（Nash Equilibrium）的定义直接依赖于收益：一个策略组合 $s^* = (s_1^*, s_2^*, \ldots, s_n^*)$ 构成纳什均衡，当且仅当对每个参与人 $i$ 和其任意偏离策略 $s_i'$ ，都有：

u_i(s_i^*, s_{-i}^*) \ge u_i(s_i', s_{-i}^*)

其中 $s_{-i}^*$ 表示除参与人 $i$ 外其他参与人的策略组合。换言之，在纳什均衡中，任何参与人都无法通过单方面改变自己的策略而获得更高的收益。

在贝叶斯博弈（Bayesian Game）中，收益函数还依赖于参与人的类型（Type），因此参与人 $i$ 的收益通常写为 $u_i(s_i, s_{-i}, \theta_i)$ ，其中 $\theta_i$ 是参与人 $i$ 的私人信息。此时，参与人最大化的是其条件期望收益，而贝叶斯纳什均衡（Bayesian Nash Equilibrium）要求每个类型的参与人在给定其信念下选择最优策略。

收益函数的概念在机制设计（Mechanism Design）和拍卖理论（Auction Theory）中同样不可或缺。机制设计者通过设计收益函数（支付规则）来激励参与人如实报告私人信息，从而实现预期的配置目标。显示原理（Revelation Principle）的核心思想正是通过巧妙的收益结构设计，使得诚实成为一种占优策略。

收益在经济学中的应用

博弈论收益的概念已经在经济学多个分支中得到广泛应用。在产业组织理论（Industrial Organization）中，企业的收益表现为利润函数，企业在古诺竞争（Cournot Competition）和伯川德竞争（Bertrand Competition）中的策略选择直接影响其收益。在劳动经济学（Labor Economics）中，效率工资（Efficiency Wage）模型通过设定工人偷懒与不偷懒的收益函数差异来解释高于市场出清水平的工资。在契约理论（Contract Theory）和委托代理模型（Principal-Agent Model）中，委托人的收益函数受到代理人努力水平的随机影响，最优契约设计本质上是对收益分配机制的优化。

在行为经济学（Behavioral Economics）领域，收益概念也得到进一步拓展。前景理论（Prospect Theory）将收益相对于参考点（Reference Point）来定义，区分了收益域（Gain Domain）和损失域（Loss Domain），并发现决策者在这两个域中的风险态度不对称。这修正了传统期望效用理论中收益仅被视为最终财富水平的设定，为理解真实人类决策提供了更精确的分析工具。

总之，收益作为博弈论和决策理论的基础性概念，其定义、表征和应用贯穿了整个现代经济学的分析体系。从个体决策到策略互动，从完全信息到不完全信息，从理性模型到行为模型，收益函数始终是连接建模假设与现实经济运行的核心纽带。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。