博弈论练习题 第一组 参考答案

合集下载

(完整版)上海商学院---博弈论习题参考答案(Part.Ⅰ)

(完整版)上海商学院---博弈论习题参考答案(Part.Ⅰ)

《博弈论》习题参考答案(Part.Ⅰ)一、选择题1.B2.C3.A4.A5.B6.ABCD7.C 8.B 9.C二、判断正误并说明理由1.F 上策均衡是比纳什均衡更严格的均衡概论2.T 上策均衡是比纳什均衡更严格的均衡概论3.T 博弈类型按局中人数多少分为单人博弈、双人博弈和多人博弈4.F 博弈双方偏好存在差异的条件下,一个博弈模型中可能存在2个纳什均衡,如性别战5.T 零和博弈指参与博弈各方在严格竞争下,一方收益等于另一方损失,博弈各方收益与损失之和恒为零,所以双方不存在合作可能性6.T 上策均衡是通过严格下策消去法(重复剔除下策)所得到的占优策略,只能有一个纳什均衡7.F 纳什均衡是上策的集合,指在给定的别人策略情况下,博弈方总是选择利益相对较大的策略,并不保证结果是最好的。

8.F 局中人总是以自己的利益最大化选择自己的策略,并不以对方收益的变化为目标9.T 纳什均衡是上策的集合,指在给定的别人策略情况下,没有人会改变自己的策略而减低自己的收益10.F 局中人总是以自己的利益最大化选择自己的策略,并不以对方收益的变化为目标11.F 局中人总是以自己的利益最大化选择自己的策略,并不以对方收益的变化为目标12.T 虽然斯塔格伯格模型各方利润总和小于古诺模型,但是领导者的利润比古诺模型时高三、计算与分析题1、 (1)画出A 、B 两企业的损益矩阵。

(2)求纯策略纳什均衡。

(做广告,做广告)2、画出两企业的损益矩阵求纳什均衡。

(1)画出A 、B两企业的损益矩阵(2)求纳什均衡。

两个:(原价,原价),(涨价,涨价) 3、假定某博弈的报酬矩阵如下:甲乙 左 右 上 下(1)如果(上,左)是上策均衡,那么,a>?, b>?, g<?, f>? 答:a>e, b>d, f>h, g<c(2)如果(上,左)是纳什均衡,上述哪几个不等式必须满足? 答:a>e, b>d 4、答:(1)将这一市场用囚徒困境的博弈加以表示。

“博弈论”习题及参考答案

“博弈论”习题及参考答案

《博弈论》习题一、单项选择题1.博弈论中,局中人从一个博弈中得到的结果常被称为()。

A. 效用B. 支付C. 决策D. 利润2.博弈中通常包括下面的内容,除了()。

A.局中人B.占优战略均衡C.策略D.支付3.在具有占优战略均衡的囚徒困境博弈中()。

A.只有一个囚徒会坦白B.两个囚徒都没有坦白C.两个囚徒都会坦白D.任何坦白都被法庭否决了4.在多次重复的双头博弈中,每一个博弈者努力()。

A.使行业的总利润达到最大B.使另一个博弈者的利润最小C.使其市场份额最大D.使其利润最大5.一个博弈中,直接决定局中人支付的因素是()。

A. 策略组合B. 策略C. 信息D. 行动6.对博弈中的每一个博弈者而言,无论对手作何选择,其总是拥有惟一最佳行为,此时的博弈具有()。

A.囚徒困境式的均衡B.一报还一报的均衡C.占优策略均衡D.激发战略均衡7.如果另一个博弈者在前一期合作,博弈者就在现期合作;但如果另一个博弈者在前一期违约,博弈者在现期也违约的策略称为()。

A.一报还一报的策略B.激发策略C.双头策略D.主导企业策略8.在囚徒困境的博弈中,合作策略会导致()。

A.博弈双方都获胜B.博弈双方都失败C.使得先采取行动者获胜D.使得后采取行动者获胜9.在什么时候,囚徒困境式博弈均衡最可能实现()。

A. 当一个垄断竞争行业是由一个主导企业控制时B.当一个寡头行业面对的是重复博弈时C.当一个垄断行业被迫重复地与一个寡头行业博弈时D. 当一个寡头行业进行一次博弈时10.一个企业采取的行为与另一个企业在前一阶段采取的行为一致,这种策略是一种()。

A.主导策略B.激发策略C.一报还一报策略D.主导策略11.关于策略式博弈,正确的说法是()。

A. 策略式博弈无法刻划动态博弈B. 策略式博弈无法表明行动顺序C. 策略式博弈更容易求解D. 策略式博弈就是一个支付矩阵12.下列关于策略的叙述哪个是错误的():A. 策略是局中人选择的一套行动计划;B. 参与博弈的每一个局中人都有若干个策略;C. 一个局中人在原博弈中的策略和在子博弈中的策略是相同的;D. 策略与行动是两个不同的概念,策略是行动的规则,而不是行动本身。

大学mooc博弈论(首师大)满分章节测验答案

大学mooc博弈论(首师大)满分章节测验答案

第一讲认识博弈论1单选(10分)博弈论的基本要素以下内容,除了()。

A.策略与策略集B.均衡C.支付与支付函数D.局中人正确答案:B你选对了2单选(10分)博弈论的基本假设是强调()。

A.均衡状态B.利益最大化C.个人理性D.集体理性正确答案:C你选对了3单选(10分)哪种表述模型更适合表示二人博弈()。

A.特征函数式B.标准式C.扩展式D.以上都不适合正确答案:B你选对了4单选(10分)根据人们行动为相互作用时,参与人能否达成一个具有约束力的协议,可将博弈分为( )。

A.静态博弈与动态博弈B.常和博弈与非常和博弈C.完全信息博弈与不完全信息博弈D.合作博弈与非合作博弈正确答案:D你选对了5单选(10分)“要想在现代社会做一个有文化的人,你必须对博弈论有一个大致了解”出自哪位诺贝尔经济学奖获得者的名言( )。

A.1994年诺贝尔经济学奖获得者John·NashB.2012年诺贝尔经济学奖获得者Lloyd S. ShapleyC.2005年诺贝尔经济学奖获得者Robert·AumannD.1970年诺贝尔经济学奖获得者Paul A. Samuelson正确答案:D你选对了6多选(15分)博弈论的研究特点包括()。

A.博弈论存在信息的对称性B.博弈论涉及的决策者至少为两人C.博弈论存在信息的不对称性D.博弈论需要考虑其他决策者的决策对自身利益的影响正确答案:B、C、D你选对了7多选(15分)“囚徒困境”反映了()。

A.“看不见的手”是有力的,但不是万能的B.个人理性通过市场机制导致社会福利最优的结论并不总是成立的C.个体理性与集体理性的冲突D.以自我利益为目标的“理性”行为,最终导致了两个囚徒得到相对较劣的收益正确答案:A、B、C、D你选对了8判断(5分)博弈论是一种以数学为基础、研究发生对抗与冲突时如何选择最优策略的一门学问。

正确答案:√你选对了9判断(5分)博弈论是单向的理性决策。

博弈论习题及解答

博弈论习题及解答

※第一章绪论§1.21. 什么是博弈论?博弈有哪些基本表示方法?各种表示法的基本要素是什么?(见教材)2. 分别用规范式和扩展式表示下面的博弈。

两个相互竞争的企业考虑同时推出一种相似的产品。

如果两家企业都推出这种产品,那么他们每家将获得利润400万元;如果只有一家企业推出新产品,那么它将获得利润700万元,没有推出新产品的企业亏损600万元;如果两家企业都不推出该产品,则每家企业获得200万元的利润。

企业B推出不推出企业A推出 (400,400) (700,-600) 不推出(-600,700) (-500,-500)3. 什么是特征函数? (见教材)4. 产生“囚犯困境”的原因是什么?你能否举出现实经济活动中囚徒困境的例子?原因:个体理性与集体理性的矛盾。

例子:厂商之间的价格战,广告竞争等。

※第二章完全信息的静态博弈和纳什均衡1. 什么是纳什均衡? (见教材)2. 剔除以下规范式博弈中的严格劣策略,再求出纯策略纳什均衡。

先剔除甲的严格劣策略3,再剔除乙的严格劣策略2,得如下矩阵博弈。

然后用划线法求出该矩阵博弈的纯策略Nash均衡。

乙甲1 31 2,0 4,22 3,4 2,33. 求出下面博弈的纳什均衡。

乙L R甲U 5,0 0,8 D 2,6 4,5由划线法易知,该矩阵博弈没有纯策略Nash均衡。

由表达式(2.3.13)~(2.3.16)可得如下不等式组Q=a+d-b-c=7,q=d-b=4,R=0+5-8-6=-9,r=-1将这些数据代入(2.3.19)和(2.3.22),可得混合策略Nash均衡((),()) 4. 用图解法求矩阵博弈的解。

解:设局中人1采用混合策略(x,1-x),其中x∈[0,1],于是有:,其中F(x)=min{x+3(1-x),-x+5(1-x),3x-3(1-x)}令z=x+3(1-x),z=-x+5(1-x),z=3x-3(1-x)作出三条直线,如下图,图中粗的折线,就是F(x)的图象由图可知,纳什均衡点与β1无关,所以原问题化为新的2*2矩阵博弈:由公式计算得:。

博弈论练习1答案.docx

博弈论练习1答案.docx

博弈论练习一答案一、名词解释博弈:一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略屮进行选择并加以实施,各自取得相应结果的过程。

零和博弈:所有博弈方在每种策略组合下的得益的总和始终为0的博弈。

完全信息静态博弈:纳什均衡:定义在博弃G = {Si,u\» ••• t }中•知果由各个博弈方的各一个策咯组成的某个策咯组合(对•…,§;)中,任一溥弈方i的策略彳• 都是对其余得弃方策略的组合(彳•・・・•对】,$二,・・・,<)的最佳对策,也即U t (si f V I 八:• $二1 ・•・・♦ $;)$如(斗♦心» $g,$二1 ,•••,$;)对任意%GS,都成立,则称〈sf ,•・•■$:)为G的一个絃纳什均#r w(Nash Equilibrium) 0 混合策略:定义在博弈G= {Si,S H M L▼・•・,%}中,博弈方:的策略空间为S t = {/]「・・,》}♦則博弈方i以概率分布pi =(加>随机在其k 个可选簞略中选择的“策略”,称为一个紀混合策略”,其中0W九<1对j = 1,…M都成止,且伽+…+如=1©纳什定理:无限次廛复博弈民间定理:设G是一个完全信息的赭态博弈。

用(€1»…,弘)记G的纳什均衡的得益■用(心刀表示G的任意可实现得益。

如果竝对任意博弈方i都成立,而5足够换近1,那么无限次重复博弃G(g. 6)中一定存在一个子博弈克美的纳什均衡,各博弈方的平均得益.就是(工],…,X M) o 动态博弈除了各博弈方同时决策的静态博弈以外,也有大量现实决策活动构成的博弈中,各博弈方的选择和行动不仅有先后次序,而且后选择、后行动的博弈方在自己选择、行动之前,可以看到其他博弈方的选择、行动,甚至还包括自己的选择和行动。

这种博弈无论在哪种意义上都无法看作同时决策的静态博弈,我们把这种博弈称为“动态博弈"(Dynamic Games)子博弈:由一个动态博弈第一阶段以外的某阶段开始的后续博弈阶段构成的, 有初始信息集和进行博弈所需要的全部信息,能够自成一个博弈的原博弈的一 部分,称为原动态博弈的一个“子博弈”。

“博弈论”习题及参考答案

“博弈论”习题及参考答案

《博弈论》习题一、单项选择题1.博弈论中,局中人从一个博弈中得到的结果常被称为()。

A. 效用B. 支付C. 决策D. 利润2.博弈中通常包括下面的内容,除了()。

A.局中人B.占优战略均衡C.策略D.支付3.在具有占优战略均衡的囚徒困境博弈中()。

A.只有一个囚徒会坦白B.两个囚徒都没有坦白C.两个囚徒都会坦白D.任何坦白都被法庭否决了4.在多次重复的双头博弈中,每一个博弈者努力()。

A.使行业的总利润达到最大B.使另一个博弈者的利润最小C.使其市场份额最大D.使其利润最大5.一个博弈中,直接决定局中人支付的因素是()。

A. 策略组合B. 策略C. 信息D. 行动6.对博弈中的每一个博弈者而言,无论对手作何选择,其总是拥有惟一最佳行为,此时的博弈具有()。

A.囚徒困境式的均衡B.一报还一报的均衡C.占优策略均衡D.激发战略均衡7.如果另一个博弈者在前一期合作,博弈者就在现期合作;但如果另一个博弈者在前一期违约,博弈者在现期也违约的策略称为()。

A.一报还一报的策略B.激发策略C.双头策略D.主导企业策略8.在囚徒困境的博弈中,合作策略会导致()。

A.博弈双方都获胜B.博弈双方都失败C.使得先采取行动者获胜D.使得后采取行动者获胜9.在什么时候,囚徒困境式博弈均衡最可能实现()。

A. 当一个垄断竞争行业是由一个主导企业控制时B.当一个寡头行业面对的是重复博弈时C.当一个垄断行业被迫重复地与一个寡头行业博弈时D. 当一个寡头行业进行一次博弈时10.一个企业采取的行为与另一个企业在前一阶段采取的行为一致,这种策略是一种()。

A.主导策略B.激发策略C.一报还一报策略D.主导策略11.关于策略式博弈,正确的说法是()。

A. 策略式博弈无法刻划动态博弈B. 策略式博弈无法表明行动顺序C. 策略式博弈更容易求解D. 策略式博弈就是一个支付矩阵12.下列关于策略的叙述哪个是错误的():A. 策略是局中人选择的一套行动计划;B. 参与博弈的每一个局中人都有若干个策略;C. 一个局中人在原博弈中的策略和在子博弈中的策略是相同的;D. 策略与行动是两个不同的概念,策略是行动的规则,而不是行动本身。

“博弈论”习题及参考答案

“博弈论”习题及参考答案

《博弈论》习题一、单项选择题1.博弈论中,局中人从一个博弈中得到的结果常被称为()。

A. 效用B. 支付C. 决策D. 利润2.博弈中通常包括下面的内容,除了()。

A.局中人B.占优战略均衡C.策略D.支付3.在具有占优战略均衡的囚徒困境博弈中()。

A.只有一个囚徒会坦白B.两个囚徒都没有坦白C.两个囚徒都会坦白D.任何坦白都被法庭否决了4.在多次重复的双头博弈中,每一个博弈者努力()。

A.使行业的总利润达到最大B.使另一个博弈者的利润最小C.使其市场份额最大D.使其利润最大5.一个博弈中,直接决定局中人支付的因素是()。

A. 策略组合B. 策略C. 信息D. 行动6.对博弈中的每一个博弈者而言,无论对手作何选择,其总是拥有惟一最佳行为,此时的博弈具有()。

A.囚徒困境式的均衡B.一报还一报的均衡C.占优策略均衡D.激发战略均衡7.如果另一个博弈者在前一期合作,博弈者就在现期合作;但如果另一个博弈者在前一期违约,博弈者在现期也违约的策略称为()。

A.一报还一报的策略B.激发策略C.双头策略D.主导企业策略8.在囚徒困境的博弈中,合作策略会导致()。

A.博弈双方都获胜B.博弈双方都失败C.使得先采取行动者获胜D.使得后采取行动者获胜9.在什么时候,囚徒困境式博弈均衡最可能实现()。

A. 当一个垄断竞争行业是由一个主导企业控制时B.当一个寡头行业面对的是重复博弈时C.当一个垄断行业被迫重复地与一个寡头行业博弈时D. 当一个寡头行业进行一次博弈时10.一个企业采取的行为与另一个企业在前一阶段采取的行为一致,这种策略是一种()。

A.主导策略B.激发策略C.一报还一报策略D.主导策略11.关于策略式博弈,正确的说法是()。

A. 策略式博弈无法刻划动态博弈B. 策略式博弈无法表明行动顺序C. 策略式博弈更容易求解D. 策略式博弈就是一个支付矩阵12.下列关于策略的叙述哪个是错误的():A. 策略是局中人选择的一套行动计划;B. 参与博弈的每一个局中人都有若干个策略;C. 一个局中人在原博弈中的策略和在子博弈中的策略是相同的;D. 策略与行动是两个不同的概念,策略是行动的规则,而不是行动本身。

经济博弈论习题答案

经济博弈论习题答案

经济博弈论习题答案经济博弈论是研究在不同经济主体之间存在利益冲突和相互依赖的情况下,如何通过策略选择来实现最优结果的学科。

以下是一些经济博弈论习题的答案示例:# 习题一:囚徒困境问题描述:两个犯罪嫌疑人被分别关押,且不能相互沟通。

检察官分别向他们提出交易:如果其中一个认罪而另一个不认罪,认罪者将获得轻判,而不认罪者将受到重判。

如果两人都认罪,他们将都受到中等程度的惩罚。

如果两人都不认罪,他们将因为证据不足而受到最轻的惩罚。

答案:在囚徒困境中,尽管两人都不认罪是最优的集体结果,但出于个人理性,每个人都倾向于认罪以避免最坏的结果。

因此,最终两人都认罪,导致一个次优的结果。

# 习题二:纳什均衡问题描述:考虑一个双寡头市场,两个公司A和B可以选择高成本或低成本生产。

如果一家公司选择低成本而另一家选择高成本,低成本公司将获得全部市场份额。

如果两家都选择低成本,他们将分享市场但利润较低。

如果两家都选择高成本,他们将获得较高的利润但市场份额相同。

| | A选择低成本 | A选择高成本 ||-|-|--|| B选择低成本 | 利润高,市场份额大 | 利润低,市场份额相同 | | B选择高成本 | 利润低,市场份额相同 | 利润高,市场份额相同 |答案:在这个博弈中,纳什均衡是两家公司都选择高成本生产。

因为无论对方选择什么策略,每一家都没有动机单方面改变策略,因为改变策略会导致利润降低。

# 习题三:拍卖理论问题描述:一个物品正在拍卖,有两个竞拍者,物品的真实价值为V。

每个竞拍者对物品的估值是私人信息,且他们知道对方可能的估值。

竞拍者i的估值为v_i,且v_1和v_2是独立的,都服从[0, V]的均匀分布。

答案:在第一价格密封拍卖中,竞拍者的最优策略是按照自己的估值减去一个与对手估值分布相关的期望值来出价。

具体来说,竞拍者i的最优出价b_i是v_i减去v_i的期望值,考虑到对手的估值分布。

在这种情况下,竞拍者的出价将是他们估值的线性函数。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

4
6.一个支付组合是帕累托有效率的,当且仅当没有任何其他的支付组合可以同时 改善所有人的处境。假定A和B两人组成一个社会,可能的支付组合如下:
组合1(200,200),组合2(0,300),组合3(300,0),组合4(100,100), (这里(200,200)表示A的支付为200,B的支付为200)。 (1)假定只有如上可能的四个支付组合。找出下列支付组合中帕累托有效率的
2. 某博弈中甲乙双方各有三个策略,其相应的支付矩阵如下图所示: 问: (1)甲会不会采用策略A,为什么? (2)请剔除上述支付矩阵里的占劣策略。 (3)请找出该博弈的纯策略纳什均衡。
A 甲B
C
D 3,7 4,2 3,7
乙 E
3,5 2,7 4,8
F 1,2 6,4 2,5
1
答案:1)甲不会采用策略A,策略A是甲的劣策略,它是劣于C的。 2)对于甲而言,A是一个劣策略。对于乙而言,F是一个劣策略(做到这一步即
A.S+T>200
B.S<T, T>100
C.S<0,T>100
D.以上都不是
解答,答案为C,写出这个博弈的支付矩阵如下:

合作
斗争
合作 (100, 100) (S, T) 甲 斗争 (T, S) (0, 0)
由于这个博弈是对称的,因此,只需要解其中一个人的最优反应即可(对于 对称博弈而言,两个人的占优策略及其支付是完全相同的),我们不妨解 乙的反应。要使“斗争”为占优策略,意味着无论甲选择什么行动,对于 乙而言,斗争总是好于合作,于是,若甲选择合作,那么乙选择斗争的收 益是T,选择合作的收益是100,因此T>100;若甲选择斗争,乙选择斗争的 收益是0,选择合作的收益是S,要使对于乙而言斗争好于合作,则0>S。因 此要选C。
(6r, 6) (2+2r, 2)
“该博弈最后的均衡结果是段誉往王语嫣的衣袋里放了1元钱,而王语嫣也往自 己的衣袋里放了1元钱”,亦即根据原题目,(C,D)是一个纳什均衡。 余江锋的解法:对于王语嫣而言,D是一个占优策略,因此不需考虑王语嫣选择C 策略的情况。当王语嫣选择D的时候,段誉选择C好于D,就可以使(C,D)成为 纳什均衡。 故令6r>2+2r,解得r>1/2。
支付。 (2)在一个囚徒困境博弈里面(例如可考虑习题5中的囚徒困境博弈),找出帕
累托有效的支付。帕累托有效的支付是否是纳什均衡? 答案:1)在四种状态中,帕累托有效率的支付是组合1-3,组合4是帕累托无效
率的(组合1可以同时改善两人的支付)。 2)在囚徒困境博弈中,帕累托有效的支付不是纳什均衡。
7.假定A和B一起参加一场奇特的拍卖,拍品是100元人民币,拍卖规则是价高者 得到100元,并付给拍卖商自己的出价,出价低者完全丧失自己的出价(例如, 若A出价50元,B出价40元,则A的净收入为50元(即100元减去50元出价),而B 净损失40元),如果出价相同,则每人得50元,但需要支付给拍卖行自己的出价。 现在,假定在这场拍卖中A和B只有两个策略,C——出价90元,D——出价120元, 假定两人是同时出价(各写一个纸条交给拍卖商,由拍卖商根据A和B出价的多少 和以上的博弈规则决定100元的分配)。 (1)写出此时两人的收益矩阵,并计算出纳什均衡,写出纳什均衡下的双方净 收入。 (2)这个博弈可以对应于真实世界中的哪些情况?
但是,可以这样设想,我们不需要把囚徒困境转变成一个囚徒顺境,只需要把它 转变成一个协调博弈。
根据这一思路,只需设计这样一个罚款制度:如果观察到(G,H)或(H,G), 不妨设支付较高的一方的支付为*,则应对其处以(*-&)数额以上的罚款, 这样,就把囚徒困境博弈变成了一个协调博弈,此时,“合作,合作”是纳 什均衡(但不是占优策略纳什均衡)。
求x的取值范围)。
(2)(困难)假设在这个博弈中,你看不到具体的支付,也不知道G和H代表的
是“合作”还是“不合作”,你只知道这是一个囚徒困境博弈,假设你想用
罚款的方式来促进A和B的合作。此时你应当如何设计罚款方案,而使“合作,
合作”成为一个纳什均衡?
B
G
H
AG%,%Fra bibliotek&,*
H
*,&
#,#
解答:(1)如果对不合作的人罚款x元,则收益矩阵改为
3.(05年北京大学考研题)求下列博弈的纯策略纳什均衡。这个博弈在经典矩阵 博弈的名称是什么? 参与人 2
参与人 1 U D
L (2, 6) (0, 0)
R (5, 5) (6, 2)
答:步骤 1:先找两人的最优反应,用划圈法。(注意:划圈的时候,要记住, 如果找列参与人的最优策略,就要固定行参与人的行动。反之亦然)。
B
合作
不合作
A 合作
2,2
0,3-x
不合作
3-x,0
1-x,1-x
现在(合作,合作)是纳什均衡,亦即2>3-x,0>1-x,联合两式子,解得x>1。也 就是至少要对不合作的人罚款1元。
(2)这个题目的困难之处在于不知道G和B代表什么,也不知道具体的支付情况, 因此,你是不能对G或H的特定行为去罚款的,即使你认为初次达到的均衡是 一个囚徒困境中最坏的结果,你也不能确定罚款的数额。
博弈论练习题第一组 第一章 囚徒困境与经典矩阵博弈
习题集(2011年9月30日)
1.(单项选择)甲乙两人各在纸片上写下“合作”或“斗争”两词,然后双方同
时翻开纸片。如果两人都写“合作”,每人各得100元;若两人都写“斗争”,
两人什么也得不到;若一人写“斗争”,另一人写“合作”,则:“合作”
者得S, “斗争”者得 T。要使“斗争”为占优策略,S和T必须是( )。
3
2
D)点上达到。
3
5.考虑下面的囚徒困境博弈:
B
合作
A 合作
2,2
不合作
3,0
不合作 0,3 1,1
此时囚徒困境博弈的均衡是(不合作,不合作)。
(1)假设你想用对不合作者罚款的方法促进A和B的合作。为了使(合作,合作)
成为一个占优策略纳什均衡,你需要对不合作者罚款多少元?
(假设你可以观察到谁不合作,而且对不合作的人征缴罚款x元,这个题是让你
5
(1)这个博弈的收益矩阵如下:
C
C (-40, -40)
A
D (-20, -90)
B D
(-90, -20) (-70, -70)
用最优反应法可知,纳什均衡是(D,D),双方的净收入均为-70。
(2)这个博弈其实不是真正的拍卖(虽然也有这样的拍卖,但不典型),但它 很好地刻画了现实生活中的过度、恶性竞争。现实中人们在不断地竞争,但并不 是所有竞争都是过度竞争,过度竞争发生的条件,就是“如果一方输了,投入会 完全沉没掉”,“赢家通吃”,例如公司研发产品,价格战,考研,军备竞赛…… 在“不能输”的刺激下,各方都加紧投入,结果是两败俱伤,所谓“太宗皇帝真 长策,赚得英雄尽白头”。
值范围是多少?假设 1 ﹤r﹤ 1 ,那么纯策略纳什均衡解是什么?
3
2
2
解答:(1)这个博弈的货币收益矩阵如下:
B
C
D
C
AD
(4, 4) (6, 0)
(0, 6) (2, 2)
这是一个囚徒困境博弈,该博弈的占优策略均衡是(D,D)。
(2)段誉和王语嫣的心理支付矩阵如下:
王语嫣
C
D
C (4+4r, 4) 段誉 D (6, 0)
步骤2:两人的最优反应的组合即是纳什均衡。即(U,L)和(D,R)(注意不要 写(6,2),(2,6))。
这个博弈在经典矩阵博弈中叫做“协调博弈”。 4.A和B手中各有一个魔瓶,魔瓶中各有1元钱,他们可以把这1元钱从魔瓶取出放
入自己的衣袋,也可以把这1元钱放入对方的衣袋。但是,如果放入自己的衣 袋,这1元钱会变为2元钱,如果放入对方的衣袋,这1元钱会魔术般地变为4 元。 (1)假设A和B互不关心,只关心自己的收益,他们各自的备选行动是“把1元钱 放入自己的口袋”(可用字母D表示),“把1元钱放入对方的口袋”(可用 字母C表示)(注意只有这两个备选行动,没有其他可能的行动),写出该博 弈的货币收益矩阵,并解出它的占优策略均衡。 (2)假设A是段誉王子,B是王语嫣姑娘,段誉非常喜欢王语嫣,在计算自己的 支付时,段誉会把王语嫣的收入乘以r加在自己的收入上,而王语嫣则并不关 心段誉,她只计算自己的货币收入,例如,如果段誉有x元钱,王语嫣有y元 钱,则段誉的心理支付是x+ry,而王语嫣的心理支付为y。如果该博弈最后的 均衡结果是段誉总是往王语嫣的衣袋里放1元钱,而王语嫣也往自己的衣袋里 放了1元钱,问r的取值范围是多少? (3)假设A是贾宝玉,B是林黛玉,两人互相关爱对方,因此,在计算自己的心 理支付时,两人互相把对方的收入乘以r加在自己的收入上,例如,如果宝玉 有x元钱,黛玉有y元钱,则宝玉的心理支付是x+ry,而黛玉的心理支付为y+rx。 如果该博弈最后的均衡结果是双方都总是往对方的衣袋里放1元钱,问r的取
(3)宝玉和段誉的心理支付矩阵如下:
黛玉
C
D
C (4+4r, 4+4r) 宝玉 D (6, 6r)
(6r, 6) (2+2r, 2+2r)
由原题目,(C,C)是一个纳什均衡,由于它是对称的,因此只需要解宝玉的选 择即可确定r的取值范围,对宝玉而言,4+4r>6,6r>2+2r,解得r>1/2。
若 1 ﹤r﹤ 1 ,则6>4+4r,2+2r>6r,故而D是宝玉和黛玉的占优策略,均衡在(D,
可算正确)。 但当剔除了A和F这两个策略后,对乙而言,D又变成了劣策略,可以剔除。 当剔除了A,F,D之后,对甲而言,B是劣策略,可以剔除。因此,纳什均衡是(C,E)
相关文档
最新文档