博弈论练习题2答案
博弈期末考试题及答案

博弈期末考试题及答案一、选择题(每题2分,共20分)1. 博弈论中的“纳什均衡”是由哪位数学家提出的?A. 约翰·冯·诺伊曼B. 约翰·纳什C. 保罗·萨缪尔森D. 托马斯·谢林2. 以下哪个不是博弈论中的基本概念?A. 策略B. 收益C. 风险D. 均衡3. 在零和博弈中,一个玩家的损失等于另一个玩家的收益,那么这种博弈的总收益是:A. 正数B. 零C. 负数D. 无法确定4. 囚徒困境中,如果两个囚犯都选择背叛对方,那么:A. 他们都会受到最轻的惩罚B. 他们都会受到最重的惩罚C. 一个受到轻罚,另一个受到重罚D. 一个受到重罚,另一个获得释放5. 以下哪个是博弈论中的动态博弈?A. 石头剪刀布B. 囚徒困境C. 拍卖博弈D. 猎鹿博弈...(此处省略其他选择题)二、简答题(每题10分,共30分)1. 简述博弈论中的完全信息博弈和不完全信息博弈的区别。
2. 解释什么是“混合策略纳什均衡”,并给出一个例子。
3. 描述“公共品博弈”中的囚徒困境现象。
三、计算题(每题15分,共30分)1. 假设有两个玩家A和B,他们可以选择策略X或Y。
收益矩阵如下所示:| | X | Y |||||| X | 3,3 | 2,5 || Y | 5,2 | 4,4 |请计算并找出所有可能的纳什均衡。
2. 考虑一个重复博弈,其中两个玩家在每一轮中可以选择合作或背叛。
如果双方合作,他们各自获得收益R。
如果一方背叛而另一方合作,背叛者获得收益T,合作者获得收益S。
如果双方都背叛,他们各自获得收益P。
已知2R > T + S > R > P。
请证明在无限重复博弈中,存在一个策略组合,使得双方的长期收益都高于单次博弈的背叛收益。
四、论述题(20分)1. 论述博弈论在经济学中的应用,并给出两个具体的例子。
博弈期末考试题答案一、选择题答案1. B2. C3. B4. B5. D...(此处省略其他选择题答案)二、简答题答案1. 完全信息博弈是指所有玩家都完全知道博弈的结构和其他玩家的收益函数,而不完全信息博弈是指至少有一个玩家对博弈的结构或其它玩家的收益函数不完全了解。
博弈论考试题及答案

博弈论考试题及答案一、单项选择题(每题2分,共10题,共20分)1. 博弈论中,参与者在决策时不知道其他参与者的选择,这种博弈类型被称为:A. 完全信息博弈B. 不完全信息博弈C. 零和博弈D. 非零和博弈答案:B2. 在博弈论中,以下哪个概念描述的是参与者在博弈中所追求的目标?A. 纳什均衡B. 帕累托最优C. 占优策略D. 博弈收益答案:D3. 囚徒困境中,两个参与者如果都选择合作,他们将获得的收益是:A. 最大的B. 最小的C. 中等的D. 不确定的答案:A4. 以下哪个选项不是博弈论中的均衡概念?A. 纳什均衡B. 子博弈完美均衡C. 贝叶斯均衡答案:D5. 在博弈论中,如果一个策略在任何情况下都是最优的,那么这个策略被称为:A. 占优策略B. 纳什均衡C. 帕累托最优D. 混合策略答案:A6. 博弈论中的“混合策略”是指:A. 参与者随机选择纯策略B. 参与者总是选择相同的策略C. 参与者只选择一种策略D. 参与者不进行策略选择答案:A7. 在博弈论中,如果一个参与者的策略选择不依赖于其他参与者的策略选择,这种策略被称为:A. 占优策略B. 独立策略C. 混合策略D. 纳什均衡答案:A8. 博弈论中,以下哪个概念描述的是所有参与者都不可能通过单方面改变策略来提高自己的收益?A. 帕累托最优B. 纳什均衡C. 占优策略答案:B9. 在博弈论中,如果一个参与者的策略在其他所有参与者的策略给定时是最优的,这种策略被称为:A. 占优策略B. 纳什均衡C. 最优反应D. 混合策略答案:C10. 博弈论中的“动态博弈”是指:A. 参与者同时做出决策的博弈B. 参与者按顺序做出决策的博弈C. 参与者只进行一次决策的博弈D. 参与者不进行决策的博弈答案:B二、多项选择题(每题3分,共5题,共15分)1. 以下哪些是博弈论中的基本类型?A. 合作博弈B. 非合作博弈C. 完全信息博弈D. 不完全信息博弈答案:A, B, C, D2. 在博弈论中,以下哪些是描述均衡的概念?A. 纳什均衡B. 帕累托最优C. 占优策略均衡D. 混合策略均衡答案:A, C, D3. 以下哪些是博弈论中可能的结果?A. 帕累托最优B. 纳什均衡C. 占优策略均衡D. 混合策略均衡答案:A, B, C, D4. 在博弈论中,以下哪些是描述策略的概念?A. 纯策略B. 混合策略C. 占优策略D. 最优反应答案:A, B, C, D5. 以下哪些是博弈论中可能的决策顺序?A. 同时决策B. 顺序决策C. 重复决策D. 单次决策答案:A, B, C, D三、简答题(每题5分,共2题,共10分)1. 请简述博弈论中的“纳什均衡”是什么?答案:纳什均衡是指在一个博弈中,每个参与者都选择了自己的最优策略,并且这些策略在其他参与者的策略给定时是最优的,没有任何一个参与者可以通过单方面改变策略来提高自己的收益。
博弈论期末考试试题及答案

博弈论期末考试试题及答案# 博弈论期末考试试题及答案一、选择题(每题2分,共20分)1. 博弈论中,参与者在没有沟通的情况下进行决策,这种博弈被称为:A. 完全信息博弈B. 不完全信息博弈C. 零和博弈D. 非零和博弈答案:B2. 纳什均衡是博弈论中的一个概念,它描述了一种什么样的状态?A. 所有参与者都获得最大收益的状态B. 至少有一个参与者能获得更大收益的状态C. 没有参与者能通过单方面改变策略来获得更大收益的状态D. 所有参与者都获得相同收益的状态答案:C3. 以下哪个不是博弈论中的策略类型?A. 纯策略B. 混合策略C. 随机策略D. 确定性策略答案:D4. 博弈论中的囚徒困境指的是:A. 参与者合作可以获得最优结果B. 参与者背叛可以获得最优结果C. 参与者合作可以获得次优结果,但背叛可以获得最优结果D. 参与者背叛可以获得次优结果,但合作可以获得最优结果答案:C5. 以下哪个不是博弈论中的基本概念?A. 参与者B. 策略C. 收益D. 概率答案:D...二、简答题(每题10分,共30分)1. 解释什么是博弈论,并给出一个实际生活中的例子。
答案:博弈论是研究具有冲突和合作特征的决策者之间互动的数学理论。
在实际生活中,博弈论的一个例子是拍卖。
在拍卖中,买家(参与者)需要决定出价(策略)以赢得商品(收益),同时考虑其他买家的出价策略。
2. 描述纳什均衡的概念,并解释为什么它在博弈论中如此重要。
答案:纳什均衡是指在非合作博弈中,每个参与者选择自己的最优策略,并且考虑到其他参与者的策略选择时,没有参与者能通过单方面改变策略来获得更大的收益。
纳什均衡在博弈论中非常重要,因为它提供了一种预测参与者行为的方法,即在均衡状态下,参与者没有动机去改变他们的策略。
3. 什么是完全信息博弈和不完全信息博弈?它们之间有什么区别?答案:完全信息博弈是指所有参与者都完全知道博弈的结构和其他参与者的收益函数。
而不完全信息博弈是指至少有一个参与者对博弈的结构或其它参与者的收益函数不完全了解。
“博弈论”习题及参考答案

《博弈论》习题一、单项选择题1.博弈论中,局中人从一个博弈中得到的结果常被称为()。
A. 效用B. 支付C. 决策D. 利润2.博弈中通常包括下面的内容,除了()。
A.局中人B.占优战略均衡C.策略D.支付3.在具有占优战略均衡的囚徒困境博弈中()。
A.只有一个囚徒会坦白B.两个囚徒都没有坦白C.两个囚徒都会坦白D.任何坦白都被法庭否决了4.在多次重复的双头博弈中,每一个博弈者努力()。
A.使行业的总利润达到最大B.使另一个博弈者的利润最小C.使其市场份额最大D.使其利润最大5.一个博弈中,直接决定局中人支付的因素是()。
A. 策略组合B. 策略C. 信息D. 行动6.对博弈中的每一个博弈者而言,无论对手作何选择,其总是拥有惟一最佳行为,此时的博弈具有()。
A.囚徒困境式的均衡B.一报还一报的均衡C.占优策略均衡D.激发战略均衡7.如果另一个博弈者在前一期合作,博弈者就在现期合作;但如果另一个博弈者在前一期违约,博弈者在现期也违约的策略称为()。
A.一报还一报的策略B.激发策略C.双头策略D.主导企业策略8.在囚徒困境的博弈中,合作策略会导致()。
A.博弈双方都获胜B.博弈双方都失败C.使得先采取行动者获胜D.使得后采取行动者获胜9.在什么时候,囚徒困境式博弈均衡最可能实现()。
A. 当一个垄断竞争行业是由一个主导企业控制时B.当一个寡头行业面对的是重复博弈时C.当一个垄断行业被迫重复地与一个寡头行业博弈时D. 当一个寡头行业进行一次博弈时10.一个企业采取的行为与另一个企业在前一阶段采取的行为一致,这种策略是一种()。
A.主导策略B.激发策略C.一报还一报策略D.主导策略11.关于策略式博弈,正确的说法是()。
A. 策略式博弈无法刻划动态博弈B. 策略式博弈无法表明行动顺序C. 策略式博弈更容易求解D. 策略式博弈就是一个支付矩阵12.下列关于策略的叙述哪个是错误的():A. 策略是局中人选择的一套行动计划;B. 参与博弈的每一个局中人都有若干个策略;C. 一个局中人在原博弈中的策略和在子博弈中的策略是相同的;D. 策略与行动是两个不同的概念,策略是行动的规则,而不是行动本身。
博弈论试题及答案

博弈论试题及答案【正文】博弈论试题及答案一、选择题1.博弈论是研究:A. 地理分布B. 人类视力C. 决策制定D. 古典文学答案:C2.下列哪个不是博弈论中常见的概念?A. 纳什均衡B. 优势策略C. 输家效应D. 零和博弈答案:C3.描述纳什均衡的最佳方式是:A. 所有参与者都达到最佳策略B. 至少有一个参与者达到最佳策略C. 所有参与者都达到次优策略D. 至少有一个参与者达到次优策略答案:A4.下列哪个案例体现了零和博弈的情况?A. 两国签订贸易协定B. 赌徒在赌博中争夺赌注C. 两家公司合作推出新产品D. 好友一起玩棋盘游戏答案:B5.下列哪个不是博弈论的应用之一?A. 经济决策B. 政治博弈C. 生物进化D. 音乐创作答案:D二、填空题1.博弈论最早由_____________等人于20世纪40年代提出。
答案:冯·诺依曼(John von Neumann)2.博弈论是研究参与者间的_____________和_____________的学科。
答案:互动行为;决策制定3.零和博弈是指参与者的利益总和恒为_____________。
答案:零4.博弈论中的最佳策略指的是在其他参与者采取某个策略时,使某一参与者的_____________最大化的策略。
答案:利益5.斯坦福大学的_____________教授以其对博弈论的突出贡献而获得2005年诺贝尔经济学奖。
答案:约翰·纳什(John Nash)三、简答题1.简要解释博弈论中的纳什均衡。
答:纳什均衡是博弈论中的一个重要概念,指的是在参与者选择自己最佳策略的情况下,不存在任何一个参与者可以通过单独改变自己的策略来获得更好收益的状态。
简言之,纳什均衡是一种理性选择下的稳定状态。
2.举例说明博弈论在实际生活中的应用。
答:博弈论在经济学、政治学、生物学等领域中都有广泛应用。
例如,在贸易谈判中,两个国家之间的博弈就是典型的博弈论应用。
南开大学智慧树知到“经济学”《初级博弈论》网课测试题答案2

南开大学智慧树知到“经济学”《初级博弈论》网课测试题答案(图片大小可自由调整)第1卷一.综合考核(共15题)1.当静态贝叶斯博弈中博弈方的一个策略组合是贝叶斯纳什均衡时,意味着不会有任何一个博弈方想要改变自己策略中的哪怕只是一种类型下的一个行动。
()A.正确B.错误2.有限理性意味着所有博弈方都不会采用完全理性博弈的均衡策略。
()A.正确B.错误3.乙向甲索要1000元,并且威胁甲如果不给就与他同归于尽。
当然甲不一定会相信乙的威胁。
请用扩展形表示该博弈,并找出纯策略纳什均衡和子博弈完美纳什均衡。
4.若对一个博弈运用严格下策反复消去法后,如果该博弈的策略组合中只有惟一一个幸存下来,这个策略组合就是该博弈的结果。
()A.正确B.错误5.不允许存在有约束力协议的博弈称为非合作博弈。
()A.错误B.正确6.教育程度在劳动力市场招聘员工时受到重视的理由是,经济学已经证明教育对于提高劳动力素质有不可替代的作用。
()A.正确B.错误7.囚徒的困境博弈中的(坦白,坦白)不是一个上策均衡。
()A.错误B.正确8.追求集体利益最大化称为“集体理性”。
()A.正确B.错误9.因为零和博弈中博弈方之间的关系都是竞争性的、对立的,因此零和博弈就是非合作博弈。
()A.正确B.错误10.无限次重复博弈均衡解的得益一定优于原博弈均衡解的得益。
()A.错误B.正确11.因为上策均衡反映了所有博弈方的绝对偏好,因此非常稳定,根据上策均衡可以对博弈结果作出最肯定的预测。
()A.错误B.正确12.静态贝叶斯博弈与完全信息博弈之间在策略和策略空间相同。
()A.正确B.错误13.古玩市场的交易中买卖双方的后悔都来自于自己对古玩价值判断的失误,若预先对价值的判断是正确的,那么交易者肯定不会后悔。
()A.正确B.错误14.不完美信息动态博弈的基本特征之一是博弈方之间在信息方面是不对称的。
()A.正确B.错误15.因为零和博弈中博弈方之间的关系都是竞争性的、对立的,因此零和博弈就是非合作博弈。
博弈论考试题及答案

博弈论考试题及答案一、选择题(每题2分,共20分)1. 博弈论中的“囚徒困境”是指什么?A. 两个囚犯相互合作B. 两个囚犯相互背叛C. 两个囚犯中一个合作一个背叛D. 两个囚犯相互猜疑答案:B2. 以下哪个不是博弈论中的基本概念?A. 策略B. 收益C. 公平D. 纳什均衡答案:C3. 在零和博弈中,一个玩家的损失等于另一个玩家的收益,这意味着:A. 总收益为零B. 总收益为正C. 总收益为负D. 总收益不确定答案:A4. 博弈论中的“混合策略”是指:A. 玩家随机选择策略B. 玩家固定选择一种策略C. 玩家根据对手的策略选择策略D. 玩家不使用策略答案:A5. 以下哪个是博弈论中的“完全信息”博弈?A. 拍卖博弈B. 石头剪刀布C. 桥牌D. 信息不对称博弈答案:C6. 博弈论中的“重复博弈”指的是:A. 博弈只进行一次B. 博弈进行多次C. 博弈进行无限次D. 博弈进行有限次但次数未知答案:B7. 以下哪个是博弈论中的“动态博弈”?A. 零和博弈B. 非零和博弈C. 同时博弈D. 顺序博弈答案:D8. 在博弈论中,如果一个策略组合是纳什均衡,那么:A. 每个玩家都有动机单方面改变策略B. 每个玩家都满足于当前策略C. 至少有一个玩家不满意当前策略D. 所有玩家都不满意当前策略答案:B9. 博弈论中的“合作博弈”是指:A. 玩家之间可以形成联盟B. 玩家之间不能形成联盟C. 玩家之间只能通过竞争来获得收益D. 玩家之间只能通过合作来获得收益答案:A10. 以下哪个是博弈论中的“公共知识”?A. 每个玩家的收益函数B. 每个玩家的策略选择C. 每个玩家的偏好D. 每个玩家的个人信息答案:A二、简答题(每题10分,共30分)1. 简述博弈论中的“纳什均衡”概念。
答案:纳什均衡是指在一个博弈中,每个玩家都选择了自己的最优策略,并且没有玩家能够通过单方面改变策略来提高自己的收益。
在纳什均衡状态下,每个玩家的策略是对其他玩家策略的最优反应。
博弈论各章节课后习题答案 (2)

(1)
( q1*, q*2,⋯, q*n )组成该博弈的纯策略纳什均衡点。
2
∑ 式(1)两边同时求和,可得:
n
q*i
=
Q*
=
n(a
−
c
−
Q* )
,于是
Q*
=
n (a n +1
−
c)
,
i =1
q*
=
a
−c
−
Q*
=
a−c n +1
,此时
p*=a-Q*=
a + nc n +1
,当
n
趋于无群大时,有
Q*=a-c,
(aij + d)x*i y j 是成 立的 , 此即 为 XA2Y* ≤ X*A2Y* ≤ X*A2Y 。所以
i =1 j=1
i =1 j=1
(X*,Y*)是矩阵博弈 G2 的纳什均衡点,并且
mn
mn
∑ ∑ ∑ ∑ v(G2) =
(a ij
+
d)x
* i
y*j
=
aijx*i y*j + d = v(G1) + d
第二章 完全信息的静态博弈和纳什均衡
1. 什么是纳什均衡? (见教材)
2. 剔除以下规范式博弈中的严格劣策略,再求出纯策略纳什均衡。
先剔除甲的严格劣策略 3,再剔除乙的严格劣策略 2,得如下矩阵博弈。然后用划线法求出该矩
阵博弈的纯策略 Nash 均衡。
乙
甲
1
3
1
2,0 4,2
2
3,4 2,3
3. 求出下面博弈的纳什均衡。
该博弈的纳什均衡为下图的线段 AB:即:s1+s2=100,s1,s2∈[0,100]。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
博弈论练习题2答案111111111111111111博弈论练习题(四)一、什么是子博弈精炼纳什均衡?答:将纳什均衡中包含的不可置信的威胁策略剔除出去。
它要求参与者的决策在任何时点上都是最优的。
由于剔除了不可置信的威胁,在许多情况下,精炼纳什均衡也就缩小了纳什均衡的个数。
只有当参与人的策略在每一个子博弈中都构成纳什均衡叫做精炼纳什均衡。
或者说,组成精炼纳什均衡的策略必须在每一个子博弈中都是最优的。
二、参与人的理性问题对动态博弈分析的影响是否比静态博弈的影响更大?为什么?答:正确,博弈论要求个体具有始终追求自身利益最大化的理性意识和理性能力的“自我”个体理性,这是静态博弈的范畴。
除此之外,还要求相关的参与者具有层次较高的“交互理性”,要求不同个体之间在理性和行为方面具有一种“默契”。
即,人们的自身利益的最大化不仅取决于自己的选择,还取决于与之相关的其他人的选择与行为,那么为了实现自己的最大利益,个体的理性决策就必须考虑他人的理性选择与行为。
作为博弈论的基础,交互理性是其基本的理性要求。
博弈论还要求有关博弈的结构、各个博弈参与者的得益函数以及各个博弈参与者的理性等“知识”是所有博弈参与者之间的“共同知识”。
也就是,每个博弈参与者不仅要首先明确自己和其他参与者所有可选的策略,还需知晓各种情况下自己最终的收益或其概率分布,并且每个博弈参与者都知道各个参与者掌握这些信息;更为重要的是,每个博弈参与者都知道所有参与者都是理性的,都知道其他博弈参与者知道所有参与者都是理性的,都知道其他博弈参与者知道其他博弈参与者知道所有博弈参与者都是理性的------。
理性的共同知识假设是非合作博弈理论的一个非常重要和关键的假设,是实现交互理性和理性主义的纳什均衡的基本前提,这些,都是动态博弈的范畴。
因此说,参与者理性问题对动态博弈的分析影响更大。
三、纳什均衡和精炼纳什均衡存在哪些问题?答:纳什均衡存在的问题:(1)不是所有博弈都存在纳什均衡如纯策略就不存在混合策略则一定会存在纳什均衡,它是通过概率来计算纳什均衡,在这种均衡下,给定其他参与人的策略选择概率,每个参与人都可以为自己确定选择每一种策略的最优概率。
(2)在论及纳什均衡时,我们假设参与人是完全理性的,而且是假定参与人之间不允许达成任何协议的非合作博弈的均衡解。
而现实并非如此。
精炼纳什均衡存在的问题:有限重复博弈的子博弈精炼纳什均衡有如下定理∶令G是阶段博弈,G(T)是重复T次的重复博弈。
那么,如果G 有唯一的纳什均衡,重复博弈G(T)的唯一子博弈精炼纳什均衡结果是阶段博弈G的纳什均衡重复T次。
这个定理成立的条件是单阶段纳什均衡的“唯一性” ,若纳什均衡不是唯一的,上述定理的结论就不一定成立。
四、有限次重复博弈和无限次重复博弈有什么区别?这些区别对我们有什么启发?答:有限次重复博弈与无限次重复博弈都属于动态博弈,对于有限次博弈,收益是每次收益的简单相加,可以采取子博弈纳什均衡的方法求解,即逆推法;但无限次博弈却不能采取;此外,有限次博弈中博弈的双方都还是关注的是自己短期的利益,而无限次博弈中博弈的双方可能针对某项事情达成协议,达到共谋,为共同的利益而选择自己的行动,达到整体的最优,供应链契约即类似。
五、有限次重复博弈的精炼纳什均衡的最后一次重复必定是第一阶段博弈的一个纳什均衡?答:博弈重复次数有限,意味着存在所有参与人都可以预测到的“最后一次”。
在最后的阶段博弈中,如果某一参与人选择了自己的占优战略,给其他参与人造成损失,则其他参与人不可能报复。
所有的参与人都明白这一点,因而在最后一次阶段博弈中都会选择占优战略,换句话说,在给定最后阶段所有参与人都会选择占优战略的前提下,所有的参与人在倒数第二阶段的博弈中也都会选择占优战略。
由此从最后的阶段开始,逐个阶段进行推理,可以得出以下结论:在阶段博弈有唯一的纳什均衡时,有限次重复博弈的唯一子博弈精炼纳什均衡结果,是阶段博弈的纳什均衡重复。
这就是说,每个阶段博弈出现的都是一次性博弈的均衡结果。
六、无限次重复博弈均衡解的得益一定会优于原博弈均衡解的得益吗?答:不一定。
例如:无限次重复博弈的古诺博弈,此博弈是相同博弈重复无限次,当冷酷战略是整个博弈的纳什均衡时,当然也就是每个阶段的纳什均衡。
此时,无限次重复古诺博弈的冷酷战略已意味着是两厂商在两种战略间进行选择的囚徒困境博弈,一是选择生产垄断产量的一半Q/2,另一是选择生产背叛产量时,冷酷战略是无限次重复古诺博弈的一个子博弈精炼纳什均衡。
贴现因子较大说明未来的利益较大,对两厂商都有较大的吸引力,一般情况下,两厂商不会为了短期利益而背叛对方而失去较大的长远利益,即两厂商都有坚持冷酷战略的积极性。
而当时,意味着冷酷战略不再是一个子博弈精炼纳什均衡。
贴现因子较小说明未来的利益对两厂商都不具有吸引力,选择背叛才是两厂商的最优选择。
这种条件下,博弈无限次重复也不能提高一次性博弈的得益。
七、触发战略所构成的均衡都是子博弈精炼纳什均衡吗?答:“触发战略”是这样一种战略∶首先试探合作,如果对方合作,则给予奖励;如果对方不合作,则给以惩罚。
在原博弈有多个纳什均衡的条件下,在重复博弈时,通过触发战略提高了双方的收益。
首先,在第二次博弈时意味着该博弈结束,而均衡结果是原博弈的纳什均衡,双方都没有偏离的意愿;其次,第一次选的策略虽不是原博弈的纳什均衡,如果某一方偏离会增加收益,但这样会遭到对方第二次选另外的策略的惩罚而损失收益,使总得益减少。
预见到这一点,只顾眼前不顾长远的偏离是得不偿失的事,因此双方会坚持选使总收益最大的策略。
所以,触发战略构成的均衡都是子博弈精炼纳什均衡。
八、什么是冷酷战略?什么是针锋相对战略?什么是最小最大战略?答:冷酷战略也称为触发战略,这种战略做法是∶1、参与人在博弈开始时均选择合作;2、只要对方一直选择合作,则继续合作下去,但当某一时刻对方选择了不合作,则一直永远选择不合作来惩罚对方的背叛行为。
针锋相对战略:参与人在博弈开始时选择合作;在时期t选择对方在时期t-1期所采用的战略,即如果对方在t-1期背叛(不合作),则自己在t期也选择背叛。
最小最大战略:最小最大战略是指当违规者不采取合作行为而对他进行惩罚时,违规者可能得到的最严厉的制裁的战略(相应的,违规者为了减少惩罚对自己的影响,而使自己得益最大的战略。
练习题(五)一、若你正在考虑收购一家公司的一万股股票,卖方的开价是2元/股。
根据经营情况的好坏,该公司股票的价值对你来说有1元/股和5元/股两种可能,但只有卖方知道经营的真实情况,你只知经营好、坏的概率各为0.5。
如果公司经营不好时,卖方做到使你无法识别真实情况的“包装”费为5万元,你是否会按卖方的价格买下这些股票?如果“包装”费仅为0.5万元,你会如何选择?答:当卖方使买房无法识别真实情况的包装费为5万元时,买方的股票价值期望值为E=0.5×﹙1-5﹚+0 .5×5=0.5元/股在这种情况下,无法接受卖方给出的价格当卖方的包装费为0.5万元时,买方的股票价值期望值为E=0.5×﹙1-0.5﹚+0 .5×5=2.75元/股在这种情况下,接受卖方给出的价格二、现实生活中常常是既有部分卖假冒伪劣产品的厂商会打出“质量三包”、“假一罚十”等旗号,也有一些卖假冒伪劣产品的厂商声明“售出商品概不退换”。
问这两类厂商有什么不同,他们各自战略的根据是什么?答:第一类厂商实行战略的根据是:“最大最小战略”,根据无限次重复博弈中的子博弈精炼纳什均衡实际上是参与人相互合作的结果,要使合作成功,其战略中必须要有惩罚措施。
所谓最小最大战略是指当违规者不采取合作行为而对他进行惩罚时,违规者可能得到的最严厉的制裁的战略。
第二类厂商采取战略的根据是:“冷酷战略”,任何为了短期利益的背叛行为的所得对长期利益而言都是微不足道的,且会遭到对方一直背叛的冷酷打击,故参与人有积极性为自己建立一个乐于合作的声誉,同时也有积极性惩罚对方的背叛行为。
三、在有两个投标者的暗标拍卖中,投标者的估价独立分布于[0,1]且两人的估价相同,则贝叶斯纳什均衡是什么?博弈的结果是什么?如果两投标者知道他们的估价是相同的,结果会发生什么变化?解:两个人投标人为i ,j,投标者i 的支付如下:最终解得,拍卖的对称贝叶斯均衡战略为∶⎪⎩⎪⎨⎧<=->-=j i j i i i j i i i i j i i s s s s s ss s s s u ,0,2/)(),(θθθ;2/*i i s θ=同理可得,对投标人j 也可得到相同的结论即,在只有两个投标人时,这个博弈的贝叶斯均衡是,每个投标人的出价是其实际价值的一半。
如果两个投标者知道他们的估价相同,即信息是完全的,买者之间的竞争将使卖者得到买者价值的全部。
四、“说实话”的直接机制能保证博弈方都按他们的真实类型行为并获得理想的结果。
答:“说实话的直接机制”。
即如果所设计的直接机制能使得各投标人讲真话,也就是声明自己的真实类型(如对商品的真实价值)是贝叶斯纳什均衡,则称这样的直接机制为“说实话的直接机制”。
也称为“激励—相容”或“鼓励—响应”机制。
如果代理人从讲真话中得到稍高的效用,则讲真话变为强均衡。
事实上,如果讲真话的效用足够强,则代理问题以及与之相联系的成本将会消失,能保证博弈方都按他们的真实类型行为并获得理想的结果。
2/*j j s θ=五、静态贝叶斯博弈中之所以博弈方需要针对自己的所有可能类型设定行为选择,是因为能够迷惑其他博弈方,从而可以获得对自己更有利的均衡。
答:正确。
不完全信息静态博弈的静态贝叶斯纳什均衡实际上是这样一种类型依从型战略组合∶给定自己的类型和别人类型的概率分布情况下,每个参与人最大化自己的期望效用。
博弈方需要针对自己的所有可能类型设定行为选择,是因为能够迷惑其他博弈方,从而可以获得对自己更有利的均衡六、什么是贝叶斯纳什均衡? 答:n 人不完全信息静态博弈:的纯战战略贝叶斯纳什均衡是一个类型依存战略组合,其中每个参与人i 在给定自己的类型 和其他参与人类型依存战略 ,的情况下最大化自己的期望效用函数 ,换言之,战略组合 是一个贝叶斯纳什均衡,如果对于所有的i , 有,贝叶斯纳什均衡实际上是这样一种类型},,;,,;,,;,,{1111n n n n u u p p A A G ΛΛΛΛθθ=iθ)(*i i a --θi u )}(,),({*1*1*n n a a a θθΛ=),(i i i A a θ∈},);(,{)(max arg )(**i i i i i i i i i a i i a a u p a i ----∑∈θθθθθθ依从型战略组合∶给定自己的类型和别人类型的概率分布情况下,每个参与人最大化自己的期望效用。