ARTICLE

反应函数

定义 反应函数(Reaction Function),亦称最优反应函数(Best Response Function),是博弈论与微观经济学中的核心分析工具。它描述在一个战略互动环境中,参与者(如厂商、国家或个体)在给定竞争对手策略选择的前提下,为最大化自身收益而会采取的最优行动。简言之,反应函数回答了"如果我知道对手会怎么做,我该如何应对最有利?"这一基本

浏览 61 更新 2026-05-26

定义

反应函数(Reaction Function),亦称最优反应函数(Best Response Function),是博弈论微观经济学中的核心分析工具。它描述在一个战略互动环境中,参与者(如厂商、国家或个体)在给定竞争对手策略选择的前提下,为最大化自身收益而会采取的最优行动。简言之,反应函数回答了"如果我知道对手会怎么做,我该如何应对最有利?"这一基本问题。它将对手的每一种可能行动映射到自身的一个最优应对之上,形成一种策略上的对应关系。该概念在分析寡头垄断市场的竞争行为时尤为重要,典型应用包括古诺模型伯特兰模型。更广泛而言,反应函数同样适用于国际贸易中的关税博弈、政治学中的竞选策略分析,以及生物学中的进化博弈论研究。反应函数的思想根源可追溯到安东尼·奥古斯丁·库诺在1838年对双头垄断的数学分析,这一开创性工作奠定了现代博弈论中战略互动的分析基础,其影响至今仍贯穿于产业组织、公共经济学和政治经济学等多个领域。

数学定义

考虑一个包含 n n 个参与者的博弈。令 Si S_i 表示参与者 i i 策略空间ui:S1×S2××SnR u_i: S_1 \times S_2 \times \cdots \times S_n \to \mathbb{R} 收益函数。参与者 i i 的反应函数 Ri:SiSi R_i: S_{-i} \to S_i (其中 Si S_{-i} 表示除 i i 外所有其他参与者的策略组合空间)定义为:

Ri(si)=argmaxsiSiui(si,si)R_i(s_{-i}) = \arg\max_{s_i \in S_i} u_i(s_i, s_{-i})

即对于给定的其他参与者策略 si s_{-i} Ri(si) R_i(s_{-i}) 是使 i i 的收益最大化的策略。若存在多个最优策略,反应函数可表现为集值映射,即每个竞争对手策略对应一组无差异的最优策略。反应函数的存在性依赖于收益函数的连续性和策略空间的凸性拓扑性质。具体而言,若策略空间为非空紧凸集,且收益函数关于自身策略拟凹、关于所有策略连续,则根据角谷不动点定理,反应函数存在至少一个不动点,这一不动点正是纳什均衡的存在性基础。在连续策略空间中,反应函数通常是光滑的曲线或超曲面;在离散策略空间中,反应函数则表现为最优策略的集合,分析时往往通过列支方式刻画参与者的反应模式。

古诺模型中的推导

理解反应函数的最佳方式是通过具体例子。考虑一个简单的双头垄断古诺模型,两个厂商生产同质产品并同时决定产量。设市场需求曲线为 P=abQ P = a - bQ ,其中 Q=q1+q2 Q = q_1 + q_2 ;两厂商具有相同且恒定的边际成本 c c ,无固定成本。厂商1的利润函数为:

π1(q1,q2)=(ab(q1+q2))q1cq1\pi_1(q_1, q_2) = (a - b(q_1 + q_2))q_1 - cq_1

古诺模型的核心假设是每个厂商将竞争对手的产量视为给定常数。对 π1 \pi_1 求关于 q1 q_1 偏导数并令其为零,得到一阶条件

π1q1=a2bq1bq2c=0\frac{\partial \pi_1}{\partial q_1} = a - 2bq_1 - bq_2 - c = 0

解得厂商1的反应函数:

q1=ac2b12q2q_1 = \frac{a-c}{2b} - \frac{1}{2}q_2

同理,厂商2的反应函数为 q2=ac2b12q1 q_2 = \frac{a-c}{2b} - \frac{1}{2}q_1 。反应函数斜率为负,表明古诺竞争中的产量是战略替代品——一方增产会压低市场价格,削弱另一方的增产动机。这一推导过程清晰地展示了反应函数的生成机制:从参与者的目标函数出发,利用优化的一阶条件求解出策略之间的显式依赖关系。值得注意的是,二阶条件 2π1q12=2b<0 \frac{\partial^2 \pi_1}{\partial q_1^2} = -2b < 0 确保了所求极值为最大值而非最小值,因此反应函数确实对应着利润最大化的产量选择。

反应函数与纳什均衡

反应函数的关键用途在于找到纳什均衡。纳什均衡是指给定其他参与者策略的条件下,无人有动机单方面改变自身策略的状态。在古诺模型中,均衡点 (q1,q2) (q_1^*, q_2^*) 必须同时满足两个反应函数。联立求解:

q1=ac2b12q2,q2=ac2b12q1q_1^* = \frac{a-c}{2b} - \frac{1}{2}q_2^*,\quad q_2^* = \frac{a-c}{2b} - \frac{1}{2}q_1^*

代入得 q1=q2=ac3b q_1^* = q_2^* = \frac{a-c}{3b} ,均衡价格 P=a+2c3 P^* = \frac{a+2c}{3} ,各厂商利润 πi=(ac)29b \pi_i^* = \frac{(a-c)^2}{9b} 。与垄断完全竞争相比,古诺双头垄断的产量、价格和利润居于两者之间。在图形上,纳什均衡即两条反应函数曲线的交点。两条直线均向下倾斜,斜率绝对值小于一,交点唯一且稳定——这意味着从任何初始产量组合出发,通过逐轮调整都将收敛至均衡点。这一收敛过程直观地展示了博弈论中的"学习"机制:即使参与者并非一次性达到均衡,通过重复观察和调整也能逐步趋向最优策略组合。

不同模型中的反应函数

反应函数的具体形式因博弈设定而异。在古诺竞争中,产量为战略替代品,反应函数向下倾斜;厂商数量增多时,均衡趋近完全竞争结果。在伯特兰竞争中,厂商进行价格竞争,对同质产品而言最优反应是设定略低于对手的价格,直至价格降至边际成本——这一结论被称为"伯特兰悖论",因为它与古诺竞争的结论形成鲜明对比。此时价格是战略互补品,反应函数向上倾斜。在斯塔克尔伯格竞争中,博弈为序贯博弈,领导者在决策时预见到跟随者将依反应函数行动,因而将跟随者的反应函数嵌入自身利润最大化问题中,从而获得"先动优势"——领导者产量高于古诺水平,利润也随之增加。在公共品贡献博弈中,参与者的反应函数反映搭便车动机——他人贡献越多,自身最优贡献越少,形成向下倾斜的反应曲线。此外,在讨价还价理论中,谈判双方的反应函数决定了报价序列的收敛方向与最终协议的分割比例,体现了反应函数在非市场互动情境中的广泛应用。

局限与挑战

反应函数虽是强大的分析工具,但存在若干局限。其一,在不完美信息博弈中,参与者无法准确观察对手策略,需依赖信念期望进行决策,此时反应函数的概念需要扩展为贝叶斯反应函数。其二,当博弈存在多重均衡时,反应函数的交点不唯一,需借助精炼概念进一步筛选出更为合理的均衡。其三,反应函数本质上是静态分析工具,对于重复博弈中可能出现的合作行为,需要更复杂的动态框架——如触发策略和民间定理——加以分析。此外,收益函数的非线性或策略空间的非凸性可能导致反应函数不存在或非连续,增加求解难度。现实中,参与者的决策往往受到认知偏差和信息成本的约束,而标准反应函数框架假定完全理性和完美信息,这在一定程度上限制了对真实行为的解释力。行为经济学的研究表明,参与者并非总能精确计算最优反应,而是倾向于使用启发式规则或模仿他人行为,这为反应函数理论的修正和扩展提供了新的方向。