ARTICLE

行玩家

行玩家 (Row Player) 行玩家（Row Player）是博弈论中用于描述策略型博弈（Normal-Form Game）或支付矩阵表示法的基本术语。在二人博弈的支付矩阵（Payoff Matrix）中，行玩家指其纯策略集合对应矩阵各行的那一位参与者；另一位参与者则称为列玩家（Column Player），其策略对应矩阵各列。行玩家与列玩家的区分是博弈

浏览 0 更新 2026-07-20

行玩家 (Row Player)

行玩家（Row Player）是博弈论中用于描述策略型博弈（Normal-Form Game）或支付矩阵表示法的基本术语。在二人博弈的支付矩阵（Payoff Matrix）中，行玩家指其纯策略集合对应矩阵各行的那一位参与者；另一位参与者则称为列玩家（Column Player），其策略对应矩阵各列。行玩家与列玩家的区分是博弈论教学中引入纳什均衡、混合策略和极大极小策略等核心概念时的标准分析框架。

支付矩阵中的位置约定

在标准的二人博弈矩阵表示中，约定如下：

行玩家有 $m$ 个纯策略，记为 $R_1, R_2, \ldots, R_m$ ，分别对应矩阵的第 $1$ 至第 $m$ 行。
列玩家有 $n$ 个纯策略，记为 $C_1, C_2, \ldots, C_n$ ，分别对应矩阵的第 $1$ 至第 $n$ 列。
矩阵的每一单元格 $(i, j)$ 包含两个数值：第一个为行玩家的收益，第二个为列玩家的收益，记为 $(a_{ij}, b_{ij})$ 。

例如，经典的囚徒困境中，行玩家与列玩家均面临「合作」与「背叛」两个策略。矩阵中 (合作, 合作) 对应双方各得 $-1$ ；(背叛, 背叛) 对应双方各得 $-5$ 。行玩家通过选择行来最大化自身收益，但其最终收益取决于列玩家的同时选择。

行玩家视角下的均衡概念

纯策略纳什均衡。从行玩家视角出发，对列玩家的每一个策略 $C_j$ ，行玩家寻找使自身收益最大化的行 $i^*$ ： $a_{i^*j} \ge a_{ij}$ 对所有 $i$ 成立。纳什均衡要求双方同时达到最优反应：存在策略组合 $(i^*, j^*)$ 使得行玩家在列玩家选 $j^*$ 时没有动机偏离 $i^*$ ，且列玩家在行玩家选 $i^*$ 时没有动机偏离 $j^*$ 。

混合策略。行玩家的混合策略为定义在纯策略集合上的概率分布 $\mathbf{p} = (p_1, \ldots, p_m)$ ，满足 $p_i \ge 0$ 且 $\sum_i p_i = 1$ 。行玩家以概率 $p_i$ 选择纯策略 $R_i$ 。给定列玩家的混合策略 $\mathbf{q} = (q_1, \ldots, q_n)$ ，行玩家的期望收益为：

U_R(\mathbf{p}, \mathbf{q}) = \sum_{i=1}^{m} \sum_{j=1}^{n} p_i \cdot a_{ij} \cdot q_j = \mathbf{p}^T \mathbf{A} \mathbf{q}

其中 $\mathbf{A} = [a_{ij}]$ 为行玩家的收益矩阵。行玩家的目标是选择 $\mathbf{p}$ 最大化该双线性形式。

零和博弈与极大极小策略

在二人零和博弈中，列玩家的收益为行玩家收益的相反数（ $b_{ij} = -a_{ij}$ ），双方利益完全对立。此时行玩家的最优策略由极大极小定理（Minimax Theorem）刻画：行玩家选择策略以最大化自身在最坏情况下的收益，即求解：

\max_{\mathbf{p}} \min_{j} \sum_{i=1}^{m} p_i a_{ij}

冯·诺依曼的极大极小定理保证了在有限二人零和博弈中，行玩家的极大极小值等于列玩家的极小极大值，且该共同值即为博弈的值（Value of the Game）。行玩家的最优混合策略（极大极小策略）确保无论列玩家如何行动，行玩家至少获得博弈值所保证的期望收益。

行玩家与博弈表示的选择

将哪位参与者设为行玩家通常是任意的，但一旦约定，所有分析（收益矩阵、最优反应对应、均衡计算）均需一致地遵循该约定。在演化博弈论中，行玩家与列玩家的非对称角色常用于分析不同种群间的策略互动；在贝叶斯博弈中，行玩家的类型空间和信念系统需与矩阵表示共同指定。行玩家作为博弈论分析的基本视角，贯穿从完全信息静态博弈到不完全信息动态博弈的全部理论体系。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。