微观经济学第八章博弈论习题精品文档16页

微观经济学第八章博弈论习题精品文档16页
微观经济学第八章博弈论习题精品文档16页

第八章博弈论

一、重点和难点

(一)重点

1.博弈论及其基本概念

2.纳什均衡

3.占优策略均衡

4.囚徒困境博弈

(二)难点

1.最小最大值(或最大最小值)策略

2.子博弈精炼纳什均衡

3.动态博弈战略行动

4.不完全信息静态博弈

5.不完全信息动态博弈

二、关键概念

博弈零和博弈非常和博弈囚徒困境纳什均衡支付子博弈精炼纳什均衡完全信息静态博弈占优策略均衡重复博弈战略移动可信威胁豪尔绍尼转换

三、习题

(一)单项选择题

1.博弈论中,局中人从一个博弈中得到的结果常被称为()。

A. 效用

B. 支付

C. 决策

D. 利润

2.博弈中通常包括下面的内容,除了()。

A.规则

B.占优战略均衡

C.策略

D.结局

3.在具有占优战略均衡的囚徒困境博弈中()。

A.只有一个囚徒会坦白

B.两个囚徒都没有坦白

C.两个囚徒都会坦白

D.任何坦白都被法庭否决了

4.在多次重复的双头博弈中,每一个博弈者努力()。

A.使行业的总利润达到最大

B.使另一个博弈者的利润最小

C.使其市场份额最大

D.使其利润最大

5.一个博弈中,直接决定局中人支付的因素是()。

A. 策略组合

B. 策略

C. 信息

D. 行动

6.对博弈中的每一个博弈者而言,无论对手作何选择,其总是拥有惟一最佳行为,此时的博弈具有()。

A.囚徒困境式的均衡

B.一报还一报的均衡

C.占优策略均衡

D.激发战略均衡

7.如果另一个博弈者在前一期合作,博弈者就在现期合作;但如果另一个博弈者在前一期违约,博弈者在现期也违约的战略称为()。

A.一报还一报的战略

B.激发战略

C.双头战略

D.主导企业战略

8.在囚徒困境的博弈中,合作策略会导致()。

A.博弈双方都获胜

B.博弈双方都失败

C.使得先采取行动者获胜

D.使得后采取行动者获胜

9.在双寡头中存在联合协议可以实现整个行业的利润最大化,则()。

A.每个企业的产量必须相等

B.该行业的产出水平是有效的

C.该行业的边际收益必须等于总产出水平的边际成本

D.如果没有联合协议,总产量会更大

10.在什么时候,囚徒困境式博弈均衡最可能实现()。

A. 当一个垄断竞争行业是由一个主导企业控制时

B.当一个寡头行业面对的是重复博弈时

C.当一个垄断行业被迫重复地与一个寡头行业博弈时

D. 当一个寡头行业进行一次博弈时

11.一个企业采取的行为与另一个企业在前一阶段采取的行为一致,这种战略是一种()。

A.主导战略

B.激发战略

C.一报还一报战略

D.无用战略

12.关于策略式博弈,正确的说法是()。

A. 策略式博弈无法刻划动态博弈

B. 策略式博弈无法表明行动顺序

C. 策略式博弈更容易求解

D. 策略式博弈就是一个支付矩阵

13.下面关于共同知识的说法,正确的是()。

A. 每一个局中人都知道的事,就是共同知识

B. 一般地,假定支付为共同知识

C. 共同知识的假定要求局中人的计算能力不是很强

D. 纳什均衡不需要共同知识的假定

14、导致价格战爆发的原因是()

A.合作均衡

B.使用一报还一报的战略的企业的出现,这一战略是其竞争者在前一阶段遵守联合协议时采取的

C.进入该行业并立刻同意遵守联合协议的新企业的出现

D.新企业进入一个行业后,所有企业发觉自己处在囚徒困境中

(二)判断说明题

1.博弈论是用来分析垄断竞争企业行为的。

2.在一次性囚徒困境博弈中,对一个囚徒来说,如果他相信另一个囚徒会坦白,则他的占优战略就是坦白。

3.因为零和博弈中博弈方之间的关系都是竞争性的、对立的,因此零和博弈就是非合作博弈。

4.凡是博弈方的选择、行为有先后次序的一定是动态博弈。

5.合作博弈就是博弈方采取相互合作态度的博弈。

6.纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。

7.如果一博弈有两个纯策略纳什均衡,则一定还存在一个混合策略均衡。

8.在动态博弈中,因为后行为的博弈方可以先观察对方行为后再选择行为,因此总是有利的。

9.多人博弈中的“破坏者”会对所有博弈方的利益产生不利影响。

10.纯策略纳什均衡和混合策略纳什均衡都不一定存在。

(三)计算题

1.北方航空公司和新华航空公司分享了从北京到南方冬天度假胜地的市场。如果它们合作,各获得500000元的垄断利润,但不受限制的竞争会使每一方的利润降至60000元。如果一方在价格决策方面选择合作而另一方却选择降低价格,则合作的厂商获利将为零,竞争厂商将获利900000元。

(1)将这一市场用囚徒困境的博弈加以表示。

(2)解释为什么均衡结果可能是两家公司都选择竞争性策略。

2.Smith 和John 玩数字匹配游戏,每个人选择1、2、3,如果数字相同, John 给Smith 3美元,如果不同,Smith 给John 1美元。

(1)列出收益矩阵。

(2)如果参与者以1/3的概率选择每一个数字,证明该混合策略存在一个纳什均衡,它为多少?

3.假设双头垄断企业的成本函数分别为:1120Q C =,2222Q C =,市场需求曲线为Q P 2400-=,其中,21Q Q Q +=。

(1)求出古诺(Cournot )均衡情况下的产量、价格和利润,求出各自的反应和等利润曲线,并图示均衡点。

(2)求出斯塔克博格(Stackelberg )均衡情况下的产量、价格和利润,并以图形表示。

(3)说明导致上述两种均衡结果差异的原因。

4.假设有两个游戏者A和B,他们分别代表两家企业,生产不同的部件,但生产的部件在型号选择上有“大”、“小”之分。若一家企业选择的型号为“大”,另一家企业选择的型号为“小”,则会发生不匹配的问题。只有当两家企业选择的型号匹配时,才会有均衡。下表给出了这一合作博

(1)假设企业A先走一步,企业B的策略选择有多少种?写出A和B 的策略组合及相应的收益矩阵。

(2)在这些策略组合中,有无纳什均衡?如有,哪些是?

(3)将上述策略组合写成广延型博弈形式,并求出子博弈完美纳什均衡。

5.假设在一个博弈模型中,有两个参与者,即政府和私人部门。私人部门选择的是预期的通货膨胀率,政府选择的是实际的通货膨胀率。并且政府不仅关心通货膨胀问题,而且还关心失业问题。设政府的效用函数为:其中,π是通货膨胀率,*y是自然失业率下的均衡产量,y是实际产量,0

c,1>

k。

>

同时假定产出与通货膨胀率之间的关系是由含有通货膨胀预期的菲利浦斯曲线决定,也就是说菲利浦斯曲线是:

其中,eπ是预期的通货膨胀率,0>

β。

如果私人都具有理性预期,那么运用博弈论的有关知识来证明,在短期内政府所采取的通货膨胀政策不能增加产出。

(四)问答题

1.举一个你在现实生活中遇到的囚犯两难困境的例子。

收益。

(1)求出该博弈问题的均衡解,是占优策略均衡还是纳什均衡?

(2)存在帕累托改进吗?如果存在,在什么条件下可以实现?福利增量是多少?

(3)如何改变上述A、B企业的收益才能使均衡成为纳什均衡或占优策略均衡?如何改变上述A、B企业的收益才能使该博弈不存在均衡?

3.在纳税检查的博弈中,假设A为应纳税款,C为检查成本,F是偷税罚款,且C

存在纯战略纳什均衡。

(1)写出支付矩阵。

(2)分析混合策略纳什均衡。

(五)案例分析题

1.阅读以下材料,联系实际情况,运用所学理论进行评析。

囚徒困境中的宝洁公司

宝洁(P&G)、联合利华和花牌同时计划进入杀虫胶带市场。它们都面临同样的成本和需求条件,而各厂商必须在考虑到他的竞争者们的情况下决定一个价格。如果P&G 和它的竞争者都将价格定在1.50美元,他能得到更多的利润。这从下表中的支付矩阵中看得很清楚。如果所有厂商都定价1.50美元,它们每月各可赚到20000美元利润,而不是定价l.40美元可以赚到的12000美元。那么为什么它们不定价1.50美元呢?

联合利华和花牌定价

宝洁(P&G) l.40美元1.50美元*为单位。

因为这些厂商处在一个囚徒的困境中,不管联合利华和花牌定价多少,宝洁定价l.40美元都能赚更多的钱。例如,若联合利华和花牌定价

1.50美元,宝洁定价l.40美元每月可赚29000美元,而定价1.50美元只能赚20000美元。这对联合利华和花牌也是正确的。例如,宝洁定价l.50美元而联合利华和花牌定价1.40美元,它们将各赚到21000美元而不是20000美元。结果,宝洁知道如果它定价1.50美元,它的竞争者会有强烈的低价竞争,定价l.40美元的冲动,这样P&G 将只有一个很小的市场份额和只能赚到每月3000美元的利润。P&G 应该冒险防信任竞争者定价1.50美元吗?如果你面对这样的困境,你会怎么做呢?

2.一个工人给老板干活,工资标准是100元。工人可以选择是否偷懒,老板则选择是否克扣工资。假设工人不偷懒有相当于50元的负效用,老板想克扣工资则总有借口扣掉60元工资,工人不偷懒老板有150元产出,而工人偷懒时老板只有80元产出,但老板在支付工资之前无法知道实际产出,这些情况双方都知道。请问

(1)如果老板完全能够看出工人是否偷懒,博弈属于哪种类型?用得益矩阵或扩展形式表示该博弈并作简单分析。

(2)如果老板无法看出工人是否偷懒,博弈属于哪种类型?用得益矩阵或扩展形式表示该博弈并作简单分析。

参考答案

(一)单项选择题

1.(B )

2.(B )

3.(C )

4.(D )

5.(A )

6.

(C ) 7.(A )

8.(A) 9.(C) 10.(D) 11.(C)12.(B) 13.(B)14.(D)

(二)判断说明题

1.错

【解题思路】:本题分析博弈论与寡头垄断企业的关系。

【解析】:博弈论是用来分析寡头垄断企业行为的理论。

2.错

【解题思路】:本题分析占优战略。

【解析】:在囚徒困境博弈中,占优战略是招供,即不管对方的行为是怎样的,每个囚徒都会采取招供的战略。

3.错

【解题思路】:本题考察零和博弈和非合作博弈的关系。

【解析】:虽然零和博弈中博弈方的利益确实是对立的,但非合作博弈的含义并不是博弈方之间的关系是竞争性的、对立的,而是指博弈方是以个体理性、个体利益最大化为行为的逻辑和依据,是指博弈中不能包含有约束力的协议。

4.错

【解题思路】:本题考察动态博弈。

【解析】:其实并不是所有选择、行为有先后次序的博弈问题都是动态博弈。例如两个厂商先后确定自己的产量,但只要后确定产量的厂商在定产之前不知道另一厂商的产量是多少,就是静态博弈问题而非动态博弈问题。

5.错

【解题思路】:本题考察合作博弈。

【解析】:合作博弈在博弈论中专门指博弈方之间可以达成和运用有约束力的协议限制行为选择的博弈问题,与博弈方的态度是否合作无关。

6.错

【解题思路】:本题考察纳什均衡。

【解析】:只要任一博弈方单独改变策略不会增加利益,策略组合就是纳什均衡了。单独改变策略只能得到更小得益的策略组合是严格纳什均衡,是比纳什均衡更强的均衡概念。

7.对

【解题思路】:本题考察纳什均衡。

【解析】:这是纳什均衡的基本性质之一:奇数性所保证的。

8.错

【解题思路】:本题考察动态博弈。

【解析】:实际上动态博弈中先行为的博弈方往往是有先行优势的,因此常常是先行为的博弈方更有利而不是后行为的博弈方有利。

9.错

【解题思路】:本题考察多人博弈。

【解析】:多人博弈中的“破坏者”对博弈方的利益是否有影响和影响

方向是不确定的。事实上,正是因为这种不确定性才被视为“破坏者”。这种“破坏者”实质上是指对博弈分析造成破坏,而不是对博弈方的利益造成破坏,因此肯定会受到不利影响的是博弈分析者而不是博弈方。

10.错

【解题思路】:本题考察纳什均衡。

【解析】:虽然纯策略纳什均衡不一定存在,但在我们所分析的博弈中混合策略纳什均衡总是存在的。这正是纳什定理的根本结论。也许在有些博弈中只有惟一的纯策略纳什均衡,没有严格意义上上的混合策略纳什均衡,这时把纯策略理解成特殊的混合策略,混合策略纳什均衡就存在了。(三)计算题

1.【解题思路】:这是一个有关囚徒困境博弈的题目。

(60000>0);若新华航空公司选择合作,北方航空公司仍会选择竞争(900000>500000)。若北方航空公司选择竞争,新华航空公司也将选择竞争(60000>0);若北方航空公司选择合作,新华航空公司仍会选择竞争(900000>0)。由于双方总偏好竞争,故均衡结果为两家公司都选择竞争性策略,每一家公司所获利润均为600000元。

2.【解题思路】:这是一个有关零和博弈的题目。

【解析】:(1)此博弈的收益矩阵如下表。该博弈是零和博弈,无纳

(2)Smith选(1/3,1/3,1/3)的混合概率时,

John选1的效用为:

John选2的效用为:

John选3的效用为:

类似地,John选(1/3,1/3,1/3)的混合概率时,

Smith选1的效用为:

Smith 选2的效用为:

Smith 选3的效用为:

因为

所以:

??????)31,31,31(),31,31,31(是纳什均衡,策略值分别为John :31-=U ;Smith :3

1'=U 。 3.【解题思路】:本题考察双寡头博弈中的生产决策。

对垄断企业

(2应函数为:

则企业1 利润为:1π 企业2领先时可依此类推。

(3)当企业1为领先者时,其获得的利润要比古诺竞争下多。而企业2获得的利润较少。这是因为,企业1先行动时,其能考虑企业2的反应,并以此来制定自己的生产计划,而企业2只能被动地接受企业1的既定产量,计划自己的产出,这是一种“先动优势”。

4.【解题思路】:本题重点考察子博弈完美纳什均衡。

【解析】:(1)如果企业A 先走一步,则企业B 的策略选择有四种: ①若A 选择“大”,B 也选择“大”;若A 选择“小”,B 仍然选择“大”。 ②若A 选择“大”,B 也选择“大”;若A 选择“小”,B 也选择“小”。 ③若A 选择“大”,B 选择“小”;若A 选择“小”,B 选择“大”。

④若A 选择“大”,B 选择“小”;若A 选择“小”,B 也选择“小”。

博弈论案例分析

博弈论 博弈论(Game Theory),亦名―对策论‖、―游戏理论‖,属应用数学的一个分支,博弈论已经成为经济学的标准分析工具之一。目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。 博弈论是指某个个人或是组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,从各自选择的行为或是策略进行选择并加以实施,并从各自取得相应结果或收益的过程,在经济学上博奕论是个非常重要的理论概念。 什么是博弈论?古语有云,世事如棋。生活中每个人如同棋手,其每一个行为如同在一张看不见的棋盘上布一个子,精明慎重的棋手们相互揣摩、相互牵制,人人争赢,下出诸多精彩纷呈、变化多端的棋局。博弈论是研究棋手们―出棋‖ 招数中理性化、逻辑化的部分,并将其系统化为一门科学。换句话说,就是研究个体如何在错综复杂的相互影响中得出最合理的策略。现在,我们就一些例子来讨论博弈论相关内容。 一、从“囚徒困境”开始 在博弈论中,含有占优战略均衡的一个著名例子是由塔克给出的―囚徒困境‖(prisoners’ dilemma)博弈模型。该模型用一种特别的方式为我们讲述了一个警察与小偷的故事。假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果一个犯罪嫌疑人坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪。如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑8年;如果另一个犯罪嫌人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。下表给出了这个博弈的支付矩阵。 表囚徒困境博弈 [Prisoner's dilemma] 我们来看看这个博弈可预测的均衡是什么。对A来说,尽管他不知道B作何选择,但他知道无论B选择什么,他选择―坦白‖总是最优的。显然,根据对称性,B也会选择―坦白‖,结果是两人都被判刑8年。但是,倘若他们都选择―抵赖‖,每人只被判刑1年。在表2.2中的四种行动选择组合中,(抵赖、抵赖)是帕累托最优的,因为偏离这个行动选择组合的任何其他行动选择组合都至少会使一个人的境况变差。不难看出,―坦白‖是任一犯罪嫌疑人的占优战略,而(坦白,坦白)是一个占优战略均衡。 要了解纳什的贡献,首先要知道什么是非合作博弈问题。现在几乎所有的博弈论教科书上都会讲―囚犯的两难处境‖的例子,每本书上的例子都大同小异。 话说有一天,一位富翁在家中被杀,财物被盗。警方在此案的侦破过程中,抓到两个犯罪嫌疑人,斯卡尔菲丝和那库尔斯,并从他们的住处搜出被害人家中丢失的财物。但是,他们矢口否认曾杀过人,辩称是先发现富翁被杀,然后只是顺手牵羊偷了点儿东西。于是警方将两人隔离,分别关在不同的房间进行审讯。由地方检察官分别和每个人单独谈话。

博弈论期末习题

《博弈论》期末习题 专业:经济学学号:2 ;姓名:王兆丽 一、试写出掷硬币博弈的局中人及其策略与得益函数,并写出双变量得 益矩阵。 答:局中人:盖硬币者和猜硬币者。 策略:有正面和反面两种可选择策略,若猜对,猜者得1盖者-1.否则猜者-1盖者1.由于每一方都不会让对方在选择之前知道自己的决策,所以可以看做是同时做决策的。 双变量得益矩阵; 猜硬币方 二、试举生活中的一例,说明囚徒困境是如何产生的?并试分析可能走 出囚徒困境的途径。 答:例子:中国移动和中国联通之间的价格战。 产生原因:囚徒困境是在个体之间存在行为和利益相互制约的博弈结构中,以个体理性和个体选择为基础的分散决策方式,无法有效地协调各方面的利益,并实现整体、个体利益共同的最优。简单的说,囚徒困境问题都是个体理性与集体理性的矛盾引起的。 可能走出的囚徒困境途径:(1)惩罚。如果政府对实行价格战以获利的企业实行惩罚,那么就会制止这种现象发生。(2)忠诚文化。有时候,建立一种相互忠诚的文化也可以帮助走出囚徒困境。在很多组织中,团体产生所面临的囚徒困境问题的轻重程度是不同的,这种差异的根本来源就是各个组织有自己的文化。(3)长期关系和重复博弈。建立长期关系使得囚徒困境博弈可以多次重复,如果这个“多次”足够长,那么人们就有可能为了长远的将来利益而牺牲眼前的一笔横财,合作也是可以达成的。

三、用逆向归纳法求解下面的博弈的子博弈完美纳什均衡。 答:1、该博弈共包括四个子博弈:(1)从博弈方1选择R 以后博弈方2的第二 阶段选择开始的三阶段动态博弈;(2)从博弈方2第二阶段选择R 以后博弈方1 的开始选择的两个阶段动态博弈;(3)第三阶段博弈方1选择A 以后博弈方2 的单人博弈;(4)第三阶段博弈方1选择B 以后博弈方2的单人博弈 2、根据逆推归纳法先讨论博弈方2在第四阶段的选择。由于选择C 、D 个中 任何一个的得益都相同,因此在这阶段随意选择一个都可以。倒退回第三阶段, 博弈方1选择AB中任何一个都可以。再推回第二阶段,博弈方2选择L将得到 3选择R得到2,因此选择L;最后回到第一阶段,博弈方1选择L得到2选择 R得到3,。所以该博弈的子博弈完美纳什均衡为:博弈方1第一阶段选择R, 博弈方2第二阶段选择L,即(3,1)是该博弈的完美纳什均衡。 四、两个寡头企业进行价格竞争博弈,企业1的利润函数是 q c aq p ++--=21)(π,企业2的利润函数是p b q +--=22)(π,其中p 是企业1 的价格,q 是企业2的价格。求: 1.两个企业同时决策的纯战略纳什均衡; 两个企业同时定价。根据两个企业的得益函数,很容易导出它们各自的反应 函数:απ1 /αp = -2(p-aq+c)=0 ____ p=aq-c απ2/αq = -2(q-b)=0 ______ q=b

范里安《微观经济学:现代观点》(第9版)课后习题详解-(博弈论的应用)【圣才出品】

第30章博弈论的应用 1.在一个双人博弈纳什均衡中,每一个参与人都在针对什么作出最优的反应?在一个占优策略均衡中,每一个参与人又都在针对什么作出最优的反应? 答:(1)在纳什均衡中,每个参与人都对其他选手的最优反应作出了自己的最优反应。 (2)在一个占优策略均衡中,每个参与人的选择都是对其他选手所有选择的最优反应。特别地,占优均衡一定是纳什均衡,但纳什均衡却未必是占优均衡。 2.在有关混合策略的章节中,考虑行参与人和列参与人的最优反应。它们会产生最优反应函数吗? 答:行参与人和列参与人没有最优反应函数。如图30-1所示,这两条曲线分别体现了行参与人和列参与人对应于对方选择时的最优反应。曲线的交点就是纳什均衡。在这种情况下,博弈存在三个均衡,其中,两个是纯策略均衡,一个是混合策略均衡。当行参与人选择r=2/3时,列参与人存在无穷多个最优反应,而不是像函数的数学定义所要求的那样,只有一个最优反应。

图30-1 最优反应曲线 3.在一个合作博弈中,如果博弈双方作出相同的选择,那么,结果对于他们两个对这都令人满意。这个结论是否正确? 答:这个说法不正确。 这是因为合作博弈的结果取决于博弈的收益,而非两个人是否选择相同的策略。比如在汽车博弈中,如果双方都选择直线驾驶,他们将陷入最糟糕的境况。 4.本章正文指出,在均衡状态,行参与人在62%的时间内会得分。这个数值是如何得到的? 答:博弈的均衡策略为“行参与人按0.7的概率踢向左方,而列参与人以0.6的概率扑向左方”,由于射门方向和扑救方向共有四种组合,从而得到每种组合的概率分布如表30-1所示。 表30-1不同组合的概率分布

运筹学例题

例9 分析在原计划中是否应该安排一种新产品。以第一章例1为例。设该厂除了生产产品Ⅰ、Ⅱ外,现有一种新产品Ⅲ。已知生产产品Ⅲ,每件需要消耗原材料A ,B 各为6kg ,3kg ,使用设备2台时;每件可获利5元。问改产是否应生产该产品和生产多少?若能以10个单位的价格再买进15单位的原材料A ,这样做是否有利? ()()T B P B C c 3,6,20,125.0,5.153133-='-'='-σ =1.25>0 21max x x z += ?????? ?≥≤+-≤+为整数 21212 121,0,13651914x x x x x x x x ()T n X ??? ??=310,23 ()629=*z 2,111≥≤x x 21max x x z += 21max x x z = (IP1)?????????≥≤≤+-≤+为整数212112121,0,113651914x x x x x x x x x (IP2)????? ????≥≥≤+-≤+为整数 212112121,0,21 3651914x x x x x x x x x 继续解(IP1)和(IP2),得最优解分别为: ()()()()941,923,2310,37,12211= ?? ? ??== ??? ??=z X z X T T ()9410≤≤*z 3,221≥≤x x 21max x x z = 21max x x z +=

(IP3)??????????≥≤≥≤--为整数2121212121,0,22136x x x x x x x x (IP3)??????????≥≥≥≤+-为整数 2121212121,0,32 1 36x x x x x x x x ()()1461,2,143333=?? ? ??=z X T IP4无可行解 21max x x z += 21max x x z = (IP5)???????????≥≤≤≤+-≤+为整数2121212121,0,2113651914x x x x x x x x x x (IP6)???????????≥≤≤≤+-≤+为整数 2121212121,0,31 1 3651914x x x x x x x x x x ()()()3,2,155==z X T IP6无可行解 14613≤≤*z ()T 2,1433=不为整数 3,211≥≤x x 分别加入问题(IP3)形成两个子问题 21max x x z += 21max x x z =

博弈论第七章习题

第七章习题 一、判断下列表述是否正确,并作简单分析 (1)海萨尼转换可以把不完全信息静态博弈转换为不完美信息博弈,说明有了海萨尼转换,不完全信息静态博弈和一般的不完美信息动态博弈是等同的,不需要另外发展分析不完全信息静态博弈的专门分析方法和均衡概念。 答:错误。即使海萨尼转换把不完全信息静态博弈转换为不完美信息动态博弈,也是一种特殊的有两个阶段同时选择的不完美信息动态博弈,对这种博弈的分析进行专门讨论和定义专门均衡的概念有利于提高分析的效率。 (2)完全信息静态博弈中的混合策略可以被解释成不完全信息博弈的纯策略贝叶斯纳什均衡。 答:正确。完全信息静态博弈中的混合策略博弈几乎总是可以解释成一个有少量不完全信息的近似博弈的一个纯策略Bayes—Nash均衡。夫妻之争的混合策略Nash均衡可以用不完全信息夫妻之争博弈的Bayes—Nash均衡表示就是一个例证。 (3)证券交易所中的集合竞价交易方式本质上就是一种双方报价拍卖。 答:正确。我国证券交易中运用的集合竞价确定开盘价的方式就是一种双方报价拍卖。与一般双方报价拍卖的区别只是交易对象,标的不是一件而是有许多件。 (4)静态贝叶斯博弈中之所以博弈方需要针对自己的所有可能类型,都设定行为选择,而不是只针对实际类型设定行为选择,是因为能够迷惑其他博弈方,从而可以获得对自己更有利的均衡。

答:错误。不是因为能够迷惑其他博弈方,而是其他博弈方必然会考虑这些行为选择并作为他们行为选择的依据。因为只根据实际类型考虑行为选择就无法判断其他博弈方的策略,从而也就无法找出自己的最优策略。其实,在这种博弈中一个博弈方即使自己不设定针对自己所有类型的行为选择,其他博弈方也会替他考虑。因为设定自己所有类型下的行为,实际上是要弄清楚其他博弈方对自己策略的判断。 (5)“鼓励—响应”的直接机制能保证博弈方都按他们的真实类型行为并获得理想的结果。 答:错误。“鼓励—响应”机制也就是说真话的直接机制,实际上只保证博弈方揭示,也就是说出自己的真实类型。 博弈方不直接选择行为,也不保证根据真实类型行为,更谈不上一定能实现最理想的结果。因为直接机制的结果常常是带有随机选择机制的,并不一定理想。实际上对所有博弈方都理想的结果在静态贝叶斯博弈中本身不一定存在。 二、双寡头古诺模型,倒转的需求函数为 ()P Q a Q =-, 其中12Q q q =+为市场总需求,但a 有h a 和l a 两种可能的情况,并且厂商1知道a 究竟是h a 还是l a , 而厂商2只知道h a a =的概率是θ, l a a =的概率是1θ-,这种信息不对称情况双方都是了解的。双方的总成本仍然是i i i c q cq =。如果两厂商同时选择产量,问双方的策略空间是什么?本博弈的贝叶斯纳什均衡是什么? 解:设厂商1已知h a a =时的产量为11()h q a q =,已知l a a =时的产量是11()l q a q =;再假设厂商2的产量是 2q ,这两个函数关系就是两个厂商的策略空间。 11211()h h h h h a q q q cq π=---

运筹学例题解析

(一)线性规划建模与求解 B.样题:活力公司准备在5小时内生产甲、乙两种产品。甲、乙两种产品每生产1 单位分别消耗2小时、1小时。又根据市场需求信息,乙产品的产量应该至少是甲产品产量的3倍。已知甲、乙两种产品每销售1单位的利润分别为3百元和1百元。请问:在5小时内,甲、乙两种产品各生产多少单位,才能够使得总销售利润最大? 要求:1、建立该问题的线性规划模型。 2、用图解法求出最优解和最大销售利润值,并写出解的判断依据。如果不存在最优解,也请说明理由。 解:1、(1)设定决策变量: 设甲、乙两种产品分别生产x 1 、x 2 单位 。 (2)目标函数: max z=2 x 1+x 2 (3)约束条件如下:1221 12 25..3,0+≤??≥??≥?x x s t x x x x 2、该问题中约束条件、目标函数、可行域和顶点见图1所示,其中可行域用阴影部分标记,不等式约束条件及变量约束要标出成立的方向,目标函数只须画出其中一条等值线, 结论:本题解的情形是: 无穷多最优解 ,理由: 目标函数等值线z=2 x 1 +x 2 与 约束条件2 x 1+x 2≤5的边界平行 。甲、乙两种产品的最优产量分别为 (5,0)或(1,3)单位;最大销售利润值等于 5 百元。 (二)图论问题的建模与求解样题 A.正考样题(最短路问题的建模与求解,清华运筹学教材编写组第三版267-268页例 13)某企业使用一台设备,每年年初,企业都要做出决定,如果继续使用旧的,要付维修费;若购买一台新设备,要付购买费。但是变卖旧设备可以获得残值收入,连续使用1年、2年、3年、4年以上卖掉的设备残值分别为8万元、6万元、3万元和0万元。试制定一个5年的更新计划,使总支出最少。已知设备在各年的购买费与维修费如表2所示。要求:(1)建立某种图论模型;(2)求出最少总支出金额。

博弈论论文-共谋与防共谋案例

农村土地流转市场中三大主体博弈关系分析 摘要:以农村土地流转市场中相关利主体之间的博弈关系, 构建两人或多人博弈模型,基于博弈关系进行理论分析,分析农村土地流转市场中的社会行为,为改进农村土地流转提出对应的建议,完善农村土地流转市场。 关键词:农村土地流转、博弈、共谋与防共谋 一、农村土地流转 伴随我国工业化、信息化、城镇化和农业现代化进程,农村劳动力大量转移,农业物质技术装备水平不断提高,农户承包土地的经营权流转明显加快,发展适度规模经营已成为必然趋势。中共中央办公厅、国务院办公厅2014年11月印发《关于引导农村土地经营权有序流转发展农业适度规模经营的意见》,《关于引导农村土地经营权有序流转发展农业适度规模经营的意见》。 实践证明,土地流转和适度规模经营是发展现代农业的必由之路,有利于优化土地资源配置和提高劳动生产率,有利于保障粮食安全和主要农产品供给,有利于促进农业技术推广应用和农业增效、农民增收,应从我国人多地少、农村情况千差万别的实际出发,积极稳妥地推进。为引导农村土地(指承包耕地)经营权有序流转、发展农业适度规模经营,现提出如下意见。当前农村土地流转的主要类型为土地互换、出租、入股、合作等方式。流转土地要坚持农户自愿的原则,并经过乡级土地管理部门备案,签订流转合同。 二、集体土地流转市场中的利益主体 城乡统筹一体化进程中,在集体土地流转市场制度创新的完整过程中起着重要作用的利益主体有:乡镇政府、农村集体经济组织、农地转出方和农地转人方。 集体土地流转市场能否顺利进行是由国家(乡镇政府作为国家的代理人)、集体经济组织(包括村、组)、农地转出方与农地转入方四方相关利益主体进行博弈的结果,博弈过程是主观意愿根据其了解的情况逐步认识,最终做出结果作为理性的“经济人”,他们根据各自的利益目标,会作出不同的判断和选择,相应的得到各自的报酬。当某一方做出某项决策时,事先会受到他人决策的影响,同时反过来也会影响其他几方的行为。集体土地流转市场制度变迁在很大程度上是相关利益主体共同博弈的结果,利益主体之间的博弈结果,提出了对制度变迁的需求,需求导致了新制度的产生。根据集体土地流转市场相关利益主体之间表现出的博弈关系,进行博弈分析,有助于全面了解利益主体的策略选择,解释现行集体土地流转市场制度存在的不足,为相关管理部门和利益主体进行制度创新供决策参考。

博弈论复习题及标准答案

囚徒困境说明个人的理性选择不一定是集体的理性选择。(√) 子博弈精炼纳什均衡不是一个纳什均衡。(×) 若一个博弈出现了皆大欢喜的结局,说明该博弈是一个合作的正和博弈。( ) 博弈中知道越多的一方越有利。( ×) 纳什均衡一定是上策均衡。(×) 上策均衡一定是纳什均衡。(√) 在一个博弈中只可能存在一个纳什均衡。(×) 在一个博弈中博弈方可以有很多个。(√) 在一个博弈中如果存在多个纳什均衡则不存在上策均衡。 (√ ) 在博弈中纳什均衡是博弈双方能获得的最好结果。(×) 在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。(×)上策均衡是帕累托最优的均衡。 (×) 因为零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈就是非合作博弈。 (×) 在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行为,因此总是有利的。(×) 在博弈中存在着先动优势和后动优势,所以后行动的人不一定总有利,例如:在斯塔克伯格模型中,企业就可能具有先动优势。 囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。 (×) 纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。(√ ) 不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡,作为原博弈构成的有限次重复博弈,共同特点是重复博弈本质上不过是原博弈的简单重复,重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。(√ ) 多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径:两阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡,或者两次都采用混合战略纳什均衡,或者混合战略和纯战略轮流采用。(√) 如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡,那么可能(但不必)存在重复博弈G(T)的子博弈完美均衡结局,其中对于任意的t

运筹学复习题目加答案

一、单选题 1.目标函数取极小(minZ )的线性规划问题可以转化为目标函数取极大的线性规划问题求解,原问题的目标函数值等于( )。 A. maxZ B. max(-Z) C. –max(-Z) D.-maxZ 2.下列说法中正确的是( )。 A .基本解一定是可行解 B .基本可行解的每个分量一定非负 C .若B 是基,则B 一定是可逆 D .非基变量的系数列向量一定是线性相关的 3.在线性规划模型中,没有非负约束的变量称为 ( ) A.多余变量 B .松弛变量 C .人工变量 D .自由变量 4. 当满足最优解,且检验数为零的变量的个数大于基变量的个数时,可求得( )。 A .多重解 B .无解 C .正则解 D .退化解 5.对偶单纯型法与标准单纯型法的主要区别是每次迭代的基变量都满足最优检验但不完全满足 ( )。 A .等式约束 B .“≤”型约束 C .“≥”约束 D .非负约束 6. 原问题的第i个约束方程是“=”型,则对偶问题的变量i y 是( )。 A .多余变量 B .自由变量 C .松弛变量 D .非负变量 7.在运输方案中出现退化现象,是指数字格的数目( )。 A.等于m+n B.大于m+n-1 C.小于m+n-1 D.等于m+n-1 二、判断题 1.线性规划问题的一般模型中不能有等式约束。 2.对偶问题的对偶一定是原问题。 3.产地数与销地数相等的运输问题是产销平衡运输问题。 4.对于一个动态规划问题,应用顺推或逆解法可能会得出不同的最优解。 5.线性规划问题的每一个基本可行解对应可行域上的一个顶点。 6.线性规划问题的基本解就是基本可行解。 三、填空题 1.如果某一整数规划:MaxZ=X 1+X 2 X 1+9/14X 2≤51/14 -2X 1+X 2≤1/3 X 1,X 2≥0且均为整数 所对应的线性规划(松弛问题)的最优解为X 1=3/2,X 2=10/3,MaxZ=6/29,我们现在要对X 1进行分枝,应该分为 和 。 2.如希望I 的2 倍产量21x 恰好等于II 的产量2x ,用目标规划约束可表为: 3. 线性规划解的情形有 4. 求解指派问题的方法是 。 5.美国的R.Bellman 根据动态规划的原理提出了求解动态规划的最优化原理为 6. 在用逆向解法求动态规划时,f k (s k )的含义是:

博弈论案例分析

(1)失火了,你往哪个门跑 失火了,你往哪个门跑——这就是博弈论 一天晚上,你参加一个派对,屋里有很多人,你玩得很开心。这时候,屋里突然失火,火势很大,无法扑灭。此时你想逃生。你的面前有两个门,左门和右门,你必须在它们之间选择。但问题是,其他人也要争抢这两个门出逃。如果你选择的门是很多人选择的,那么你将因人多拥挤、冲不出去而烧死;相反,如果你选择的是较少人选择的,那么你将逃生。这里我们不考虑道德因素,你将如何选择?这就是博弈论! 你的选择必须考虑其他人的选择,而其他人的选择也考虑你的选择。你的结果——博弈论称之为支付,不仅取决于你的行动选择——博弈论称之为策略选择,同时取决于他人的策略选择。你和这群人构成一个博弈(game)。 上述博弈是一个叫张翼成的中国人在1997年提出的一个博弈论模型,被称之为少数者博弈或少数派博弈(Minority Game)。当然,原来的博弈形式不是这么简单,这里我把它简化了,我们在第三部分论述归纳推理时还要谈这个博弈模型。现在很多学者在研究这个问题。 生活中博弈的案例很多,你会见到很多例子。只要涉及到人群的互动,就有博弈。 什么叫博弈?博弈的英文为game,我们一般将它翻译成“游戏”。而在西方,game的意义不同于汉语中的游戏。在英语中,game即是

人们遵循一定规则下的活动,进行活动的人的目的是使自己“赢”。奥林匹克运动会叫Olympic Games。在英文中,game有竞赛的意思,进行game的人是很认真的,不同于汉语中游戏的概念。在汉语中,游戏有儿戏的味道。因此将关于game的理论,即game theory翻译成博弈论或者对策论,是恰当的。本书下面统称game theory为博弈论。 博弈论的出现只有50多年的历史。博弈论的开创者为诺意曼与摩根斯坦,他们1944年出版了《博弈论与经济行为》。诺意曼是着名的数学家,他同时对计算机的发明作出了巨大贡献,他去世时博弈论还未对经济学产生广泛影响,否则经济学的诺贝尔奖肯定有他的名字,因为诺贝尔奖有规定,只颁发给在世的学者。谈到博弈论,不能忽略博弈论天才纳什(John Nash)。纳什的开创性论文《n人博弈的均衡点》(1950)、《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。今天博弈论已发展成一个较完善的学科。 博弈论对于社会科学有着重要的意义,它正成为社会科学研究范式中的一种核心工具,以至于我们可称博弈论是“社会科学的数学”,或者说是关于社会的数学。从理论上讲,博弈论是研究理性的行动者(agents)相互作用的形式理论,而实际上它正深入到经济学、政治学、社会学等等,被各门社会科学所应用。甚至有学者声称要用博弈论重新改写经济学。1994年经济学诺贝尔奖颁发给三位博弈论专家:纳什、塞尔屯、哈桑尼(),而像1985年获得诺贝尔奖的公共选择学派的领导者布坎南,1995年获得诺贝尔奖的理性主义学派的领袖卢

运筹学练习题分析

第1题单选 题 A、决策变量 B、松弛变量 C、偏差变量 D、人工变量 2.第2题单选题若用图解法求解线性规划问题,则该问题所含决策变量的数目应为( ) A、二个 B、五个以下 C、三个以上 D、无限制 3.第3题单选题用单纯形法求解目标函数为极大值的线性规划问题,当所有非基变量的检验数均小于零时,表明该问题( ) A、有无穷多最优解 B、无可行解 C、有且仅有一个最优解 D、有无界解 4.第4题单选题 A、1个

B、4个 C、6个 D、9个 5.第5题单选题线性规划问题中基可行解与基解的区别在于( ) A、基解都不是可行解 B、 C、基解是凸集的边界 D、 6.第6题判断题如果线性规划问题问题存在最优解,则最优解一定对应可行域边界上的一个点 标准答案:正确 7.第7题判断题若线性规划问题有两个最优解 , 则它一定有无穷多个最优解 标准答案:正确 8.第8题判断题任何线性规划问题存在并具有唯一的对偶问题 标准答案:正确 9.第9题判断 题 标准答案:正确 10.第10题判断题对偶问题的对偶问题一定是原问题 标准答案:正确 11.第11题判断题线性规划模型中增加一个约束条件,可行域的范围一般将缩小,减少一个约束条件,可行域范围一般将扩大 标准答案:正确 12.第12题判断题线性规划问题的基解对应可行域的顶点

标准答案:错误 13.第13题判断题若线性规划的原问题有无穷多个最优解,则其对偶问题也一定具有无穷多最优解 标准答案:错误 第1题单选题对于 m 个发点、n 个收点的运输问题,叙述错误的是 ( ) A、该问题的系数矩阵有m × n 列 B、该问题的系数矩阵有 m n 行 C、该问题的系数矩阵的秩必为 m n-1 D、该问题的最优解必唯一 2.第2题单选题在解运输问题时,若已求得各个空格的改进路线和判别数,则选择调整格的原则是( ) A、在所有空格中,挑选绝对值最大的正判别数所在的空格作为调整格 B、在所有空格中,挑选绝对值最小的正判别数所在的空格作为调整格 C、在所有空格中,挑选绝对值最大的负判别数所在的空格作为调整格 D、在所有空格中,挑选绝对值最小的负判别数所在的空格作为调整格 3.第3题单选题在运输方案中出现退化现象,是指数字格的数目( ) A、等于m n B、大于m n-1 C、小于m n-1 D、等于m n-1 4.第4题单选题求最初运输方案可采用( ) A、大M法 B、位势法 C、西北角法 D、闭合回路法 5.第5题单选题 A、使诸供应点的供应总量减少G-Q B、使诸需求点的需求总量增加G-Q

博弈论经典案例与分析

博弈论的经典案例与分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A来说,囚徒B有坦白和不坦白两种可能的选择,假设囚徒B的选择是不坦白,则对囚徒A来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B选择的是坦白,则囚徒A不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B采取何种策略囚徒A的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 嫌疑犯乙

案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 价格战 案例:假设市场中仅有A 、B 两家企业,每家企业可采取的定价策略都是10元或15元,我们可以得出得益矩阵如下: 分析:无论对企业A 还是企业B 来说,低价都是他们的占优战略。从表可见,企业A 的占优战略是10元,因为无论B 采取什么战略,企业A 都能获取比定价15元更多的利润。 如果企业B 定价10元,企业A 定价10元能够获利80万元,而定价15元只能获得30万元;如果企业B 定价15元,企业A 定价10元可获利170万元,而定价15元却只能获利120万元。同样地,企业B 的占优战略也是定价10元的策略。 企业B 男

运筹学例题解析word精品

(一)线性规划建模与求解 B.样题: 活力公司准备在 5小时内生产甲、乙两种产品。甲、乙两种产品每生产 1 单位分别消耗2小时、1小时。又根据市场需求信息,乙产品的产量应该至少是甲产品产量 的3倍。已知甲、乙两种产品每销售 1单位的利润分别为 3百元和1百元。请问:在5小时 内,甲、乙两种产品各生产多少单位,才能够使得总销售利润最大? 要求:1、建立该问题的线性规划模型。 2、用图解法求出最优解和最大销售利润值, 并写出解的判断依据。如果不存在最优解, 也请说明理由。 解: 1、(1)设定决策变量: 设甲、乙两种产品分别生产 X]、X 2单位 _____________ max z=2 X 1+X 2 _________________________________ 12X 1 亠X 2 乞5 s.t X 2 _3X ! X,X 2 _0 1所示,其中可行域用阴影部分 目标函数只须画出其中一条等值线, 求解过程如下: 1?各个约束条件的边界及其方向如图 1中直线和箭头所示,其中阴影部分为可 行域,由直线相交可得其顶点 A(5,0)、 B(1,3)和 0(0,0)。 2. 画出目标函数的一条等值线 CD : 2x 什X 2=0,它沿法线向上平移,目标函数 值z 越来越大。 3. 当目标函数平移到线段 AB 时时,z ⑵目标函数:. (3)约束条件如下: 2、该问题中约束条件、目标函数、可行域和顶点见图 标记,不等式约束条件及变量约束要标出成立的方向, 顶点用大写英文字母标记。 -2 -1 X 2> 3 X 4 B(1,3) 3 图1 X2 5; A(5,O) T Max z 。 1 MaX 2

高鸿业,微观经济学,第七版,课后答案,西方经济学18第十章博弈论初步

第十章 博弈论初步 第一部分 教材配套习题本习题详解 一、简答题 1.什么是纳什均衡?纳什均衡一定是最优的吗? 解答:(1)所谓纳什均衡,是参与人的一种策略组合,在该策略组合上, 任何参与人单独改变策略都不会得到好处。 (2)不一定。如果纳什均衡存在,纳什均衡可能是最优的,也可能不是最优的。例如,在存在多个纳什均衡的情况下,其中有一些纳什均衡就不是 最优的;即使在纳什均衡是唯一时,它也可能不是最优的,因为与它相对应的支付组合可能会小于与其他策略组合相对应的支付组合。如:囚徒 困境。 2.在只有两个参与人且每个参与人都只有两个策略可供选择的情况下, 纯策略的纳什均衡最多可有几个?为什么? 解答:在只有两个参与人 (如 A和 B)且每个参与人都只有两个策略可供选择的情况下,纯策略的纳什均衡最多可有四个。例如,当A与B的支付矩阵可分别表示如下时,总的支付矩阵中所有四个单元格的两个数字均有下划线,从而,总共有四个纳什均衡。 A 的支付矩阵=??????22211211a a a a B 的支付矩阵=??? ???2221 1211b b b b 例如:a 11=a 12=a 21=a 22,b 11=b 12=b 21=b 22就会得到以上四个纳什均衡。 具体事例为: 73737373?? ?? ??

3.在只有两个参与人且每个参与人都只有两个策略可供选择的情况下,纯策略的纳什均衡可能有三个。试举一例说明。 解答:在只有两个参与人且每个参与人都只有两个策略可供选择的情况下,纯策略的 纳什均衡可能有4个、3个、2个、1个和0个五种情况,所以可能有3个。例如,当参与 人A与B的支付矩阵可分别表示如下时,总的支付矩阵中恰好有三个单元格的两个数字均有下划线,从而,总共有三个纳什均衡。 A 的支付矩阵= ??? ???22211211a a a a B 的支付矩阵=11122122b b b b ???????? A 、 B 共同的支付矩阵=1111121222222121a b a b a b a b ?? ?????? 具体事例为: 76157323?? ?? ?? 4.在只有两个参与人且每个参与人都只有两个策略可供选择的情况下,如何找到所 有的纯策略纳什均衡? 解答:可使用条件策略下划线法。具体步骤如下:首先,把整个博弈的支付矩阵分解 为两个参与人的支付矩阵;其次,在第一个 (即位于整个博弈矩阵左方的)参与人的支付矩阵中,找出每一列的最大者,并在其下画线;再次,在第二个 (在位于整个博弈矩阵上 方的)参与人的支付矩阵中,找出每一行的最大者,并在其下画线;然后,将已经画好线的两个参与人的支付矩阵再合并起来,得到带有下划线的整个博弈的支付矩阵;最后,在带有下划线的整个的支付矩阵中,找到两个数字之下均画有线的支付组合。由该支付组合 代表的策略组合就是博弈的纳什均衡。 5.设有A、B两个参与人。对于参与人A的每一个策略,参与人B的条件策略有无 可能不止一个?试举一例说明。 解答:例如,在如表10—1的二人同时博弈中,当参与人 A选择上策略时,参与人 B 既可以选择左策略,也可以选择右策略,因为他此时选择这两个策略的支付是完全一样 的。因此,对于参与人A的上策略,参与人B的条件策略有两个,即左策略和右策略。 表10—1

博弈论经典模型全解析

博弈论经典模型全解析(入门级) 1. 囚徒困境这是博弈论中最最经典的案例了——囚徒困境,非常耐人寻味。“囚徒困境”说的是两个囚犯的故事。这两个囚徒一起做坏事,结果被警察发现抓了起来,分别关在两个独立的不能互通信息的牢房里进行审讯。在这种情形下,两个囚犯都可以做出自己的选择:或者供出他的同伙(即与警察合作,从而背叛他的同伙),或者保持沉默(也就是与他的同伙合作,而不是与警察合作)。这两个囚犯都知道,如果他俩都能保持沉默的话,就都会被释放,因为只要他们拒不承认,警方无法给他们定罪。但警方也明白这一点,所以他们就给了这两个囚犯一点儿刺激:如果他们中的一个人背叛,即告发他的同伙,那么他就可以被无罪释放,同时还可以得到一笔奖金。而他的同伙就会被按照最重的罪来判决,并且为了加重惩罚,还要对他施以罚款,作为对告发者的奖赏。当然,如果这两个囚犯互相背叛的话,两个人都会被按照最重的罪来判决,谁也不会得到奖赏。那么,这两个囚犯该怎么办呢?是选择互相合作还是互相背叛?从表面上看,他们应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果:自由。但他们不得不仔细考虑对方可能采取什么选择。A犯不是个傻子,他马上意识到,他根本无法相信他的同伙不

会向警方提供对他不利的证据,然后带着一笔丰厚的奖赏出狱而去,让他独自坐牢。这种想法的诱惑力实在太大了。但他也意识到,他的同伙也不是傻子,也会这样来设想他。所以A犯的结论是,唯一理性的选择就是背叛同伙,把一切都告诉警方,因为如果他的同伙笨得只会保持沉默,那么他就会是那个带奖出狱的幸运者了。而如果他的同伙也根据这个逻辑向警方交代了,那么,A犯反正也得服刑,起码他不必在这之上再被罚款。所以其结果就是,这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应:坐牢。企业在信息化过程中需要与咨询企业、软件供应商打交道的。在与这些企业打交道的过程中,我们不可避免地也会遇到类似的两难境地,这个时候需要相互之间有足够的了解与信任,没有起码的信任做基础,切不可贸然合作。在对对方有了足够的信任之后,诚意也是必不可少的,如果没有诚意或者太过贪婪,就可能闹到双方都没有好处的糟糕情况,造成企业之间的双输。 2. 智猪博弈在博弈论(Game Theory)经济学中,“智猪博弈”是一个着名的纳什均衡的例子。假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;同时到槽边,收益比是

范里安《微观经济学:现代观点》【教材精讲+考研真题解析】第28章 博弈论 【圣才出品】

第28章博弈论 28.1本章要点 ●纳什均衡 ●囚徒困境 ●序贯博弈 28.2重难点解读 博弈论关注的是对策略互动的一般性分析,它可以应用于研究营业博弈、政治谈判和经济行为等。 一、博弈的收益矩阵 假设两人进行简单的博弈,参与人A在纸上记下“上”或“下”。同时,参与人B独立地在另一张纸上记下“左”或“右”。他们最终获得的收益如表28-1所示。

表28-1博弈的收益矩阵 占优策略:不论其他参与人如何选择,每个参与人都有一个最优策略(there is one optimal choice of strategy for each player no matter what the other player does.)。如果在某个博弈中,每个参与人都有一个占优策略,那么,可以预期这个占优策略组合就是该博弈的均衡结果。 二、纳什均衡 纳什均衡:如果其他参与人不改变自己的策略,任何一个参与人都不会改变自己策略的均衡状态。即如果给定B的选择,A的选择是最优的,并且给定A的选择,B的选择也是最优的。那么,这样一组策略就是一个纳什均衡,即给定其他人的选择,每个参与人都作出了最优的选择(each person is making the optimal choice,given the other person’s choice)。一个纳什均衡可以看作关于每个参与人的策略选择的这样一组预期,这些预期使得当任何一个人的选择被揭示后,没有人愿意改变自己的行为,如表28-2所示。 表28-2一个纳什均衡

纳什均衡的评价: 第一,一个博弈可能会存在一个以上的纳什均衡。表28-2中,策略组合(下,右)与(上,左)都是纳什均衡。 第二,有一些博弈根本不存在纳什均衡,如表28-3所示。 表28-3不存在(纯策略)纳什均衡的博弈 三、混合策略 纯策略:每个参与人只选择一种策略并始终坚持这个选择。 混合策略:参与人随机化按照概率选择策略。 混合策略纳什均衡:给定其他参与人的策略选择概率,每个参与人都为自己确定了选择每一种策略的最优概率。 表28-3所示的例子中,可以证明,如果参与人A以3/4的概率选择策略“上”,以1/4的概率选择策略“下”,参与人B以1/2的概率选择策略“左”,以1/2的概率选择策略“右”,那么,这个混合策略组合就构成一个纳什均衡。

博弈论的经典案例与分析

博弈论的经典案例与分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A 来说,囚徒B 有坦白和不坦白两种可能的选择,假设囚徒B 的选择是不坦白,则对囚徒A 来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B 选择的是坦白,则囚徒A 不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B 采取何种策略囚徒A 的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 1,1 8, 0 不坦白 0,8 5,5 坦白 嫌疑犯乙 不坦白 坦白 嫌疑犯甲 1,2 -1, -1 时装 0,0 2,1 足球 男 时装 足球 女

相关文档
最新文档