← 返回

范里安微观经济学现代观点核心速通讲义 - Lectures - 29博弈应用

版权声明:本讲义为Knowecon制作,受版权保护。未经授权,禁止复制、传播。仅供Knowecon小小班学员学习使用。

最优反应曲线 本章将介绍最优反应曲线(best response curve),这是一个用于求解博弈中均衡的重要分析工具。 定义(最优反应) 给定其他玩家的策略选择,使得某玩家收益最大化的策略选择。如果有多个选择能使收益最大化,则最优反应是所有这些选择的集合。 在一个两人博弈中,对于另一玩家的任何选择,你的最优反应是使你的收益最大化的选择。 例子 表29.1展示了一个用于说明纳什均衡(nash equilibrium)概念的博弈。 表29.1 博弈示例表 | | | | |—––|—––|—––| | | 2, 1 | 0, 0 | | | 0, 0 | 1, 2 | 在这个博弈中: - 若列玩家选择左,行玩家的最优反应是选择上。 - 若列选择右,行的最优反应是选择下。 - 类似地,列的最优反应是:对上选择左,对下选择右。 最优反应表 | | | | |—––|—––|—––| | | 2, 1 | 0, 0 | | | 0, 0 | 1, 2 | 若列认为行会选择上,则列会选择左;若行认为列会选择左,则行会选择上。因此,(上,左)是相互一致的选择。 备注 用划线法可以直观地看出这一点。 定义(纳什均衡) 在一般两人博弈中,若行有选择 \( r_{1}, \ldots, r_{R} \),列有选择 \( c_{1}, \ldots, c_{C} \),对行的每个选择 \( r \),设 \( b_{c}(r) \) 为列的最优反应;对列的每个选择 \( c \),设 \( b_{r}(c) \) 为行的最优反应。则纳什均衡为策略对 \(\left( r^{*}, c^{*} \right) \) 满足:
\[ \begin{aligned} & c^{*} = b_{c}\left( r^{*} \right) \\ & r^{*} = b_{r}\left( c^{*} \right) \end{aligned} \]
纳什均衡概念形式化了“相互一致”的思想。有时玩家对多个最优反应无差异,因此只要求 \( c^{*} \) 是列的最优反应之一,\( r^{*} \) 是行的最优反应之一。 备注 若每个选择有唯一最优反应,则最优反应曲线可表示为最优反应函数(best response function)。 最优反应曲线是古诺均衡(cournot equilibrium)的一般化。古诺均衡中,选择变量是产量,且各厂商在给定对方选择的情况下选择利润最大化的产量。类似地,伯特兰均衡(bertrand equilibrium)是定价策略的纳什均衡,各厂商选择利润最大化的价格,给定它们认为对方会做出的选择。 ### 混合策略 本节将使用最优反应函数分析表29.2中的博弈,探讨纯策略混合策略均衡。 定义(混合策略) 玩家以一定概率随机选择不同的纯策略。 - 策略选择概率: - \(r\):行玩家选择上方策略的概率(\(1-r\)为选择下方的概率) - \(c\):列玩家选择左方策略的概率(\(1-c\)为选择右方的概率) - 纯策略:当\(r\)\(c\)等于0或1时 - 行玩家的预期收益:
\[ \text{行玩家的收益} = 2rc + (1-r)(1-c) = 3rc - r - c + 1 \]
- 行玩家增加\(r\)时的收益变化:
\[ \Delta \text{收益} = (3c - 1) \Delta r \]
- \(c > \frac{1}{3}\)时,行玩家增加\(r\) - \(c < \frac{1}{3}\)时,行玩家减少\(r\) - \(c = \frac{1}{3}\)时,任何\(0 \leq r \leq 1\)都是最佳选择 - 列玩家的预期收益:
\[ \text{列玩家的收益} = cr + 2(1-c)(1-r) = 3cr - 2c - 2r + 2 \]
- 列玩家增加\(c\)时的收益变化:
\[ \Delta \text{收益} = (3r - 2) \Delta c \]
- \(r > \frac{2}{3}\)时,列玩家增加\(c\) - \(r < \frac{2}{3}\)时,列玩家减少\(c\) - \(r = \frac{2}{3}\)时,任何\(0 \leq c \leq 1\)都是最佳选择 - 最优反应曲线: - 当\(c = 0\)时,行玩家选择\(r = 0\) - 当\(c = \frac{1}{3}\)时,\(0 \leq r \leq 1\)都是最佳选择 - 当\(c > \frac{1}{3}\)时,行玩家选择\(r = 1\) 图略。 备注 最优反应曲线的交点表示纳什均衡。从图29.1可以看出,该博弈有三个纳什均衡:\((0,0)\)\((\frac{2}{3}, \frac{1}{3})\)\((1,1)\)。其中两个为纯策略均衡,一个为混合策略均衡。 备注 寻找纯策略均衡的划线法和寻找混合策略均衡的最优反应曲线法是博弈论中常用的方法。这两个方法本质上是等价的。 ### 协调博弈 协调博弈 (coordination game) 是一类特殊的博弈,其中玩家通过协调策略可以获得最高收益。本节将使用前面介绍的工具分析几种典型的协调博弈。 定义 [协调博弈] 协调博弈是一类博弈,其中玩家通过协调行为可以达到 帕累托最优 (pareto optimal) 的结果。 #### 性别之战 例:性别之战 男孩和女孩想在电影院见面,但未事先约定。男孩想看动作片,女孩想看艺术片,但他们都更希望能见面。表29.3展示了这种偏好: | | | 女孩 | 女孩 | |–––––|–––––|–––––|–––––| | | | 动作 |

Content truncated. Please enter passkey to view full content.

Knowecon Chat

$