博弈论各章节课后习题答案

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第三章纳什均衡的扩展与精炼

1.什么是完全信息和不完全信息?什么是完美信息和不完美信息?在海萨尼转换中,自然对局中人类型的确定都是有限的吗?举例说明。(见教材)

2.什么是重复博弈中的策略?什么是一个重复博弈中的子博弈?什么是一个子博弈完美纳什均衡?(见教材)

3.以下(虚线框中的)子博弈的划分是否正确?

答:两个扩展式中的子博弈划分均不正确,图1中的划分对同一信息集产生了分割,图2中的子博弈不是开始于单节信息集的决策结点。

4.在双寡头古诺模型中,设逆需求函数为p=a-Q,其中Q=q 1+q 2为市场总需求,但a 有a H 和a L 两种可能的情况,并且企业1知道a 究竟是a H 还是a L ,而企业2只知道a=a H 和a=a L 的概率分别是θ和1-θ,该信息是双方都知道的。双方的总成本函数分别是cq 1和cq 2。如果两企业同时选择产量,双方的策略空间是什么?试计算出贝叶斯纳什均衡。

假设企业2的产量为q 2,企业1将选择q 1最大化利润函数

(这里a 取a H 或a L )

)c q q a (q 12111−−−=π由此得:

)

c q a (q H H 12121

−−=)

c q a (q L L 1212

1

−−=企业2将选择q 2最大化它的期望利润

)c q q a (q )()c q q a (q )(E L L H H 2212221221−−−−+−−−=θθπ由此得:]c )q )(q (a )(a [q L H L H 2112112

1

−−+−−+=

θθθθ在均衡时,q 1,q 2应满足

⎪⎪⎩

⎪⎪⎨

⎧−−+−−+=−−=]c )q )(q (a )(a [q )c q a (q L H L H 2112121112121θθθθ由此得:

企业1的策略为:

]c c a )(a [)c a (q L H H *

H 211

1216121−+−+−−=θθ]c c a )(a [)c a (q L H L *

L 2111216121−+−+−−=

θθ企业2的策略为:

]c c a )(a [q L H *212

213

1−+−+=θθ因此博弈的贝叶斯纳什均衡是:当a=a H 时,企业1生产;当a=a L 时,企业1生产,

*H q 1*

L q 1企业2生产。

*q 25.在下面的静态贝叶斯博弈中,求出所有的纯策略贝叶斯纳什均衡。

(1)自然决定收益情况是由博弈1给出,还是由博弈2给出,选择每一博弈的概率相等;(2)局中人1了解到自然选择了博弈1,还是选择了博弈2,但局中人2不知道;(3)局中人1选择行动T 或B ,同时局中人2选择行动L 或R ;(4)根据自然选择的博弈,两局中人得到相应的收益。

博弈1

博弈2

自然选择了博弈1时,局中人1选择T ,自然选择了博弈2时,局中人1选择B 。局中人2的策略是根据期望收益最大的原则确定。

局中人2的选择策略L 的期望收益为0.5×1+0.5×0=0.5,选择策略R 的期望收益为0.5×0+0.5×2=1,因此局中人2会选择策略R 。

该博弈的纯策略贝叶斯纳什均衡为:自然选择博弈1时,局中人1选择T ,自然选择博弈2时,局中人1选择B ;局中人2会选择策略R 。

6.在一个由三寡头操纵的垄断市场中,逆需求函数为p=a-q 1-q 2-q 3,这里q i 是企业i 的产量。每一企业生产的单位成本为常数c 。三企业决定各自产量的顺序如下:(1)企业1首先选择q 1≥0;(2)企业2和企业3观察到q 1,然后同时分别选择q 2和q 3。试解出该博弈的子博弈完

L R L R T 1,10,0T 0,00,0B

0,0

0,0

B

0,0

2,2

美纳什均衡。

答:该博弈分为两个阶段,第一阶段企业1选择产量q 1,第二阶段企业2和3观测到q 1后,他们之间作一完全信息的静态博弈。我们按照逆向递归法对博弈进行求解。

(1)假设企业1已选定产量q 1,先进行第二阶段的计算。设企业2,3的利润函数分别为:

223212cq q )q q q a (−−−−=π3

23213cq q )q q q a (−−−−=π由于两企业均要追求利润最大,故对以上两式分别求一阶条件:

(1)0c q q 2q a q 3212

2

=−−−−=∂π∂(2)

0c q 2q q a q 3213

3

=−−−−=∂π∂求解(1)、(2)组成的方程组有:

(3)

3

c

q a q q 1*

3*2−−=

=(2)现进行第一阶段的博弈分析:对与企业1,其利润函数为;

1

13211cq q )q q q a (−−−−=π将(3)代入可得:

(4)

3

)

c q a (q 111−−=

π式(4)对q 1求导:

0c q 2a q 11

1

=−−=∂π∂解得:

(5)

)c a (2

1

q *1−=

此时,2*

1)c a (12

1

−=

π(3)将式(5)代回(3)和(4)有该博弈的子博弈完美纳什均衡:

,)c a (21q *

1−=

)c a (6

1q q *3*2−==7.如果将如下的囚徒困境博弈重复进行无穷次,惩罚机制为触发策略,贴现因子为δ。试问

δ应满足什么条件,才存在子博弈完美纳什均衡?

由划线法求得该博弈的纯策略纳什均衡点为(不坦白,不坦白),均衡结果为(1,1),采用触发策略,局中人i 的策略组合s 的最好反应支付=5,P i (s*)=4,P i (s c )=1。若存

)s ,s (P max )s (i i i S s i i

i −∈=φ在子博弈完美纳什均衡,必须满足:,即只有当贴现因子>1/44

1

1545)s (P )s ()s (P )s (c i *i *i *i =−−=−φ−φ≥

δδ时,才存在子博弈完美纳什均衡。

甲坦白不坦白坦白4,40,5不坦白

5,0

1,1

相关文档
最新文档