博弈论各章节课后习题答案

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

第三章纳什均衡的扩展与精炼

1.什么是完全信息和不完全信息？什么是完美信息和不完美信息？在海萨尼转换中，自然对局中人类型的确定都是有限的吗？举例说明。(见教材)

2.什么是重复博弈中的策略?什么是一个重复博弈中的子博弈?什么是一个子博弈完美纳什均衡?(见教材)

3.以下（虚线框中的）子博弈的划分是否正确?

答：两个扩展式中的子博弈划分均不正确，图1中的划分对同一信息集产生了分割，图2中的子博弈不是开始于单节信息集的决策结点。

4.在双寡头古诺模型中,设逆需求函数为p=a-Q,其中Q=q 1+q 2为市场总需求,但a 有a H 和a L 两种可能的情况,并且企业1知道a 究竟是a H 还是a L ,而企业2只知道a=a H 和a=a L 的概率分别是θ和1-θ,该信息是双方都知道的。双方的总成本函数分别是cq 1和cq 2。如果两企业同时选择产量,双方的策略空间是什么？试计算出贝叶斯纳什均衡。

假设企业2的产量为q 2，企业1将选择q 1最大化利润函数

（这里a 取a H 或a L ）

)c q q a (q 12111−−−=π由此得：

)

c q a (q H H 12121

−−=)

c q a (q L L 1212

−−=企业2将选择q 2最大化它的期望利润

)c q q a (q )()c q q a (q )(E L L H H 2212221221−−−−+−−−=θθπ由此得：]c )q )(q (a )(a [q L H L H 2112112

−−+−−+=

θθθθ在均衡时，q 1，q 2应满足

⎪⎪⎩

⎪⎪⎨

⎧−−+−−+=−−=]c )q )(q (a )(a [q )c q a (q L H L H 2112121112121θθθθ由此得：

企业1的策略为：

]c c a )(a [)c a (q L H H *

H 211

1216121−+−+−−=θθ]c c a )(a [)c a (q L H L *

L 2111216121−+−+−−=

θθ企业2的策略为：

]c c a )(a [q L H *212

213

1−+−+=θθ因此博弈的贝叶斯纳什均衡是：当a=a H 时，企业1生产；当a=a L 时，企业1生产，

*H q 1*

L q 1企业2生产。

*q 25.在下面的静态贝叶斯博弈中,求出所有的纯策略贝叶斯纳什均衡。

(1)自然决定收益情况是由博弈1给出，还是由博弈2给出，选择每一博弈的概率相等；(2)局中人1了解到自然选择了博弈1，还是选择了博弈2，但局中人2不知道；(3)局中人1选择行动T 或B ，同时局中人2选择行动L 或R ；(4)根据自然选择的博弈，两局中人得到相应的收益。

博弈1

博弈2

自然选择了博弈1时，局中人1选择T ，自然选择了博弈2时，局中人1选择B 。局中人2的策略是根据期望收益最大的原则确定。

局中人2的选择策略L 的期望收益为0.5×1+0.5×0=0.5，选择策略R 的期望收益为0.5×0+0.5×2=1，因此局中人2会选择策略R 。

该博弈的纯策略贝叶斯纳什均衡为：自然选择博弈1时，局中人1选择T ，自然选择博弈2时，局中人1选择B ；局中人2会选择策略R 。

6.在一个由三寡头操纵的垄断市场中，逆需求函数为p=a-q 1-q 2-q 3，这里q i 是企业i 的产量。每一企业生产的单位成本为常数c 。三企业决定各自产量的顺序如下：(1)企业1首先选择q 1≥0；(2)企业2和企业3观察到q 1，然后同时分别选择q 2和q 3。试解出该博弈的子博弈完

L R L R T 1,10,0T 0,00,0B

0,0

2,2

美纳什均衡。

答：该博弈分为两个阶段，第一阶段企业1选择产量q 1，第二阶段企业2和3观测到q 1后，他们之间作一完全信息的静态博弈。我们按照逆向递归法对博弈进行求解。

（1）假设企业1已选定产量q 1，先进行第二阶段的计算。设企业2，3的利润函数分别为：

223212cq q )q q q a (−−−−=π3

23213cq q )q q q a (−−−−=π由于两企业均要追求利润最大，故对以上两式分别求一阶条件：

（1）0c q q 2q a q 3212

=−−−−=∂π∂（2）

0c q 2q q a q 3213

=−−−−=∂π∂求解（1）、（2）组成的方程组有：

（3）

q a q q 1*

3*2−−=

=（2）现进行第一阶段的博弈分析：对与企业1，其利润函数为；

13211cq q )q q q a (−−−−=π将（3）代入可得：

（4）

)

c q a (q 111−−=

π式（4）对q 1求导：

0c q 2a q 11

=−−=∂π∂解得：

（5）

)c a (2

q *1−=

此时，2*

1)c a (12

−=

π（3）将式（5）代回（3）和（4）有该博弈的子博弈完美纳什均衡：

,)c a (21q *

1−=

)c a (6

1q q *3*2−==7.如果将如下的囚徒困境博弈重复进行无穷次，惩罚机制为触发策略，贴现因子为δ。试问

δ应满足什么条件，才存在子博弈完美纳什均衡？

由划线法求得该博弈的纯策略纳什均衡点为(不坦白,不坦白)，均衡结果为(1,1)，采用触发策略，局中人i 的策略组合s 的最好反应支付=5,P i (s*)=4，P i (s c )=1。若存

)s ,s (P max )s (i i i S s i i

i −∈=φ在子博弈完美纳什均衡，必须满足：，即只有当贴现因子>1/44

1545)s (P )s ()s (P )s (c i *i *i *i =−−=−φ−φ≥

δδ时，才存在子博弈完美纳什均衡。

乙

甲坦白不坦白坦白4,40,5不坦白

5,0

1,1