(◓Д◒)✄╰⋃╯
互联网被剪断了,重新连接中
/ᐠ。ꞈ。ᐟ\\
服务器被劫持了,重新连接中
← 返回
平新乔微观经济学十八讲讲义 - Lectures - 10博弈论基础
版权声明:本讲义为Knowecon制作,受版权保护。未经授权,禁止复制、传播。仅供Knowecon小小班学员学习使用。
十、策略性博弈与纳什均衡 #### 博弈论基本概念 - 游戏者:博弈中作决策的个人,目标是通过选择行动使自己的效用极大化。 - 行动:游戏者$i$可以做出的选择$a_i$,行动集$A_i = \{a_i\}$是其可能采取的全部行动之集合。 - 策略:在博弈的每一环上,游戏者的行事规则。游戏者$i$的策略集$S_i = \{s_i\}$是其所有策略的集合。 - 收益:游戏者在博弈之后获得的效用。 - 结果:博弈结束后,构模者感兴趣的要素集合。 - 均衡:$s^* = (s_1^*, s_2^*, \cdots, s_n^*)$,是博弈中$n$个游戏者各自都采取了其最优策略而产生的一个策略组合。 - 博弈的顺序:可分为同时(simultaneously)和序列(sequential)两种。 - 信息集:游戏者在博弈某一时点上关于不同变量取值的全部知识之和。 #### 囚徒困境 [图略] 四个可能的结果: 1. 双方都不揭发,效用各为5。 2. 一方揭发,一方不揭发;揭发方得6,不揭发方得-1。 3. 双方都揭发,每人效用为0。 #### 策略博弈的定义 策略博弈又称标准型博弈,由三个要素构成: - 参与博弈的游戏者名单 $I=\{1,2,\cdots,i,i+1,\cdots,I\}$ - 每一个游戏者$i$的策略集 $S_i=\{s_i\}$ - 每一个策略组合所对应的收益列表,列出该策略组合带给每一个游戏者的收益 #### 石头剪刀布的博弈 [图略] 两人博弈,双方策略集相同: $$S_1=S_2=\{\text{石头},\text{剪刀},\text{布}\}$$ 收益矩阵如图所示。该博弈有如下特点: - 二维收益矩阵 - 零和博弈 - 不存在纯策略均衡 #### 三人报数博弈 [图略] 三个游戏者$A,B,C$,每人可报$1,2,3$。\ 收益为三人所报最小数的4倍减去自己报的数。\ 该博弈有如下特点: - 三维收益矩阵,共27种可能结果 - 非零和博弈 - 存在多个纯策略均衡:$(1,1,1),(2,2,2),(3,3,3)$ - 报少者收益高于报多者,但最好策略是报一样的数 #### 占优策略 - 若对于游戏者$i$,无论对手选择什么策略,策略$s_i$总是优于$s_i'$,则称$s_i$占优于$s_i'$ - 通过排除被占优的策略,有时可得到博弈的解 [图略] #### 占优的分类 - 简单占优:只将被其他策略占优的策略排除一次 - 严格占优 - 弱占优 - 重复占优:在简单占优的基础上,继续将被其他策略占优的策略排除,直到无法再排除 重复占优的前提: - 所有游戏者都采用占优策略 - 游戏者之间对彼此的占优策略有共同认知 重复占优有时能得出博弈均衡,而简单占优则未必。 #### 最优反应的概念 最优反应是指在其他游戏者策略给定的情况下,能给游戏者带来最大收益的策略。 记$s_{-i}=(s_1,s_2,\cdots,s_{i-1},s_{i+1},\cdots,s_n)$为除游戏者$i$之外其他游戏者的策略组合,则游戏者$i$的最优反应$s_i^*$满足: $$U_i(s_i^*,s_{-i})\geqslant U_i(s_i',s_{-i}),\forall s_i'\neq s_i^*$$ 若不等式严格成立,则称$s_i^*$为严格最优反应。 #### 纳什均衡的定义 一个策略组合$s^*=(s_1^*,s_2^*,\cdots,s_n^*)$是纳什均衡,当且仅当对每个游戏者$i$,在其他游戏者策略$s_{-i}^*$给定的情况下,$s_i^*$是$i$的一个最优反应,即: $$U_i(s_i^*,s_{-i}^*)\geqslant U_i(s_i',s_{-i}^*),\forall s_i'\in S_i, \forall i\in I$$ 即当所有游戏者都选择最优反应策略,所形成的策略组合就是一个纳什均衡。 #### 纳什均衡的等价定义 记$B_i(s_{-i})$为给定$s_{-i}$时,游戏者$i$的最优反应策略集: $$B_i(s_{-i})=\{s_i^*\in S_i:U_i(s_i^*,s_{-i})\geqslant U_i(s_i',s_{-i}),\forall s_i'\in S_i\}$$ 则策略组合$s^*$是纳什均衡,当且仅当: $$s_i^*\in B_i(s_{-i}^*),\forall i\in I$$ 这启示我们找纳什均衡的方法: 1. 对每个游戏者$i$,找出其最优反应策略$s_i^*\in B_i(s_{-i})$ 2. 将所有$s_i^*$组合起来,检查是否有$s^*=(s_1^*,\cdots,s_n^*)$满足条件 #### 例:囚徒困境的纳什均衡 [图略] 分析: - 若$A$选”不揭发”,则$B$的最优反应为”揭发”$(6>5)$ - 若$B$选”揭发”,则$A$的最优反应为”揭发”$(0>-1)$ - 若$A$选”揭发”,则$B$的最优反应为”揭发”$(0>-1)$ 故(揭发,揭发)是唯一的纳什均衡。 #### 例:三人报数博弈的纳什均衡 [图略] - 给定$B,C$都选$1$,则$A$的最优反应为$1$$(3>2>1)$ - 给定$A,B$都选$1$,则$C$的最优反应为$1$ - 给定$A,C$都选$1$,则$B$的最优反应为$1$ 故$(1,1,1)$是一个纳什均衡。同理$(2,2,2)$和$(3,3,3)$也都是纳什均衡。 这个例子说明:一个博弈可能存在多个纳什均衡。 #### 例:“性别大战”博弈 [图略] 分析: - 若妻子选”芭蕾”,丈夫的最优反应为”芭蕾”$(2>1)$ - 若丈夫选”芭蕾”,妻子最优反应为”芭蕾”$(3>0)$ -
… Content truncated. Please enter passkey to view full content.
Knowecon Chat
$