平新乔微观经济学十八讲讲义 - Lectures - 10博弈论基础

版权声明：本讲义为Knowecon制作，受版权保护。未经授权，禁止复制、传播。仅供Knowecon小小班学员学习使用。

十、策略性博弈与纳什均衡 #### 博弈论基本概念 - 游戏者：博弈中作决策的个人，目标是通过选择行动使自己的效用极大化。 - 行动：游戏者 $i$ 可以做出的选择 $a_i$ ，行动集 $A_i = \{a_i\}$ 是其可能采取的全部行动之集合。 - 策略：在博弈的每一环上，游戏者的行事规则。游戏者 $i$ 的策略集 $S_i = \{s_i\}$ 是其所有策略的集合。 - 收益：游戏者在博弈之后获得的效用。 - 结果：博弈结束后，构模者感兴趣的要素集合。 - 均衡： $s^* = (s_1^, s_2^, \cdots, s_n^)$ ，是博弈中 $n$ 个游戏者各自都采取了其最优策略而产生的一个策略组合。 - 博弈的顺序：可分为同时(simultaneously)和序列(sequential)两种。 - 信息集：游戏者在博弈某一时点上关于不同变量取值的全部知识之和。 #### 囚徒困境 [图略] 四个可能的结果： 1. 双方都不揭发，效用各为5。 2. 一方揭发，一方不揭发；揭发方得6，不揭发方得-1。 3. 双方都揭发，每人效用为0。 #### 策略博弈的定义策略博弈又称标准型博弈,由三个要素构成: - 参与博弈的游戏者名单 $I=\{1,2,\cdots,i,i+1,\cdots,I\}$ - 每一个游戏者 $i$ 的策略集 $S_i=\{s_i\}$ - 每一个策略组合所对应的收益列表,列出该策略组合带给每一个游戏者的收益 #### 石头剪刀布的博弈 [图略] 两人博弈,双方策略集相同:
$$S_1=S_2=\{\text{石头},\text{剪刀},\text{布}\}$$
收益矩阵如图所示。该博弈有如下特点: - 二维收益矩阵 - 零和博弈 - 不存在纯策略均衡 #### 三人报数博弈 [图略] 三个游戏者 $A,B,C$ ,每人可报 $1,2,3$ 。\ 收益为三人所报最小数的4倍减去自己报的数。\ 该博弈有如下特点: - 三维收益矩阵,共27种可能结果 - 非零和博弈 - 存在多个纯策略均衡: $(1,1,1),(2,2,2),(3,3,3)$ - 报少者收益高于报多者,但最好策略是报一样的数 #### 占优策略 - 若对于游戏者 $i$ ,无论对手选择什么策略,策略 $s_i$ 总是优于 $s_i'$ ,则称 $s_i$ 占优于 $s_i'$ - 通过排除被占优的策略,有时可得到博弈的解 [图略] #### 占优的分类 - 简单占优:只将被其他策略占优的策略排除一次 - 严格占优 - 弱占优 - 重复占优:在简单占优的基础上,继续将被其他策略占优的策略排除,直到无法再排除重复占优的前提: - 所有游戏者都采用占优策略 - 游戏者之间对彼此的占优策略有共同认知重复占优有时能得出博弈均衡,而简单占优则未必。 #### 最优反应的概念最优反应是指在其他游戏者策略给定的情况下,能给游戏者带来最大收益的策略。记 $s_{-i}=(s_1,s_2,\cdots,s_{i-1},s_{i+1},\cdots,s_n)$ 为除游戏者 $i$ 之外其他游戏者的策略组合,则游戏者 $i$ 的最优反应 $s_i^$ 满足:
$$U_i(s_i^,s_{-i})\geqslant U_i(s_i',s_{-i}),\forall s_i'\neq s_i^$$
若不等式严格成立,则称 $s_i^$ 为严格最优反应。 #### 纳什均衡的定义一个策略组合 $s^=(s_1^,s_2^,\cdots,s_n^)$ 是纳什均衡,当且仅当对每个游戏者 $i$ ,在其他游戏者策略 $s_{-i}^$ 给定的情况下, $s_i^$ 是 $i$ 的一个最优反应,即:
$$U_i(s_i^,s_{-i}^)\geqslant U_i(s_i',s_{-i}^),\forall s_i'\in S_i, \forall i\in I$$
即当所有游戏者都选择最优反应策略,所形成的策略组合就是一个纳什均衡。 #### 纳什均衡的等价定义记 $B_i(s_{-i})$ 为给定 $s_{-i}$ 时,游戏者 $i$ 的最优反应策略集:
$$B_i(s_{-i})=\{s_i^\in S_i:U_i(s_i^,s_{-i})\geqslant U_i(s_i',s_{-i}),\forall s_i'\in S_i\}$$
则策略组合 $s^$ 是纳什均衡,当且仅当:
$$s_i^\in B_i(s_{-i}^),\forall i\in I$$
这启示我们找纳什均衡的方法: 1. 对每个游戏者 $i$ ,找出其最优反应策略 $s_i^\in B_i(s_{-i})$ 2. 将所有 $s_i^$ 组合起来,检查是否有 $s^=(s_1^,\cdots,s_n^)$ 满足条件 #### 例:囚徒困境的纳什均衡 [图略] 分析: - 若 $A$ 选”不揭发”,则 $B$ 的最优反应为”揭发” $(6>5)$ - 若 $B$ 选”揭发”,则 $A$ 的最优反应为”揭发” $(0>-1)$ - 若 $A$ 选”揭发”,则 $B$ 的最优反应为”揭发” $(0>-1)$ 故(揭发,揭发)是唯一的纳什均衡。 #### 例:三人报数博弈的纳什均衡 [图略] - 给定 $B,C$ 都选 $1$ ,则 $A$ 的最优反应为 $1$ $(3>2>1)$ - 给定 $A,B$ 都选 $1$ ,则 $C$ 的最优反应为 $1$ - 给定 $A,C$ 都选 $1$ ,则 $B$ 的最优反应为 $1$ 故 $(1,1,1)$ 是一个纳什均衡。同理 $(2,2,2)$ 和 $(3,3,3)$ 也都是纳什均衡。这个例子说明:一个博弈可能存在多个纳什均衡。 #### 例:“性别大战”博弈 [图略] 分析: - 若妻子选”芭蕾”,丈夫的最优反应为”芭蕾” $(2>1)$ - 若丈夫选”芭蕾”,妻子最优反应为”芭蕾” $(3>0)$ -

… Content truncated. Please enter passkey to view full content.

Knowecon Chat

$