(完整word版)博弈论中的几个经典问题

合集下载

博弈论中常见的一些例子

博弈论中常见的一些例子

杨义群经济管理网、杨义群投资理财网博弈论中常见的一些例子1、(夫妻争执问题)一对新婚夫妻为晚上看什么电视节目争执不下,丈夫(记为I 方)要看足球比赛节目,而妻子(记为Ⅱ方)要看戏曲节目.他们新婚燕尔,相亲相爱,所以若这方面的行动不一致,则是很伤感情的.因此,这对夫妻间的争执是一次非零和对策。

2、(entry deterrence市场威慑)设某市场已被Ⅱ方(场内者)占据,现I方(场外者)正在考虑是进去争夺(记为策略I1)还是不进去争夺(记为策略I2),而Ⅱ方相应应考虑的是采取合作共享的态度(记为策略Ⅱ1)还是采取坚决斗争的态度(记为策略Ⅱ2)。

3、(prisoner’s dilemma囚犯困境)设有两个囚犯曾犯过大罪,现因犯小罪而被捕,正分别受警方审讯.这两个囚犯都明白:如果两人都拒不坦白犯过大罪,那么当局只能以当前的小罪而判处1年徒刑;要是两人都坦白犯过大罪,那么当局将判处9年徒刑;如果一人坦白,而另一人拒不坦白,那么坦白者将会立即获得释放,另一个将会被判处10年徒刑。

(北京大学1999年研究生入学考试微观试题) 举出一个你在现实生活中遇到的囚犯两难困境的例子。

4、(两寡头降价竞争)这一模型,在数学结构上,与上例完全相同。

设某一市场上仅有两个寡头,他们分别都可以选择降价与不降价两种策略。

5、(打假)设当局对商品采取查假行动的费用为a万元,查出假货后,罚款为b万元,且销毁的假货成本为c万元;若商人出售假货,而当局不采取查假行动,则商人可额外获利d万元,且社会的进一步损失为e万元。

6、(监督博弈)设税务局查税的费用为a万元,查出逃税后,罚款为b(b>a)万元,纳税人应纳的税金为c万元。

则税务局与纳税人的该两人非零和对策模型的赢得表具体如下。

7、(boxed pigs智猪博弈)设猪圈里有一个按钮与两只猪,大猪与小猪,按一次按钮,就会有10份食品进入,大猪与小猪同时吃的话,将分别能吃到7份与3份,但去按一次按钮,必须耗费a份食品,而且按按钮者,由于耽误了时间,还将少吃到2份食品。

博弈论66个经典例子

博弈论66个经典例子

博弈论66个经典例子博弈论66个经典例子XXX:《博弈论三大经典案例》经典的囚徒困境是博弈论中最为著名的例子之一。

它由XXX和XXX在1950年提出,后来由顾问XXX以囚徒方式阐述,并命名为“囚徒困境”。

在这个困境中,警方逮捕了甲、乙两名嫌疑犯,但是没有足够的证据来指控他们。

警方将他们分开囚禁,并向他们提供以下相同的选择:如果一个人认罪并检举对方,而对方保持沉默,那么这个人将被立即释放,而对方将被判监10年。

如果两个人都保持沉默,那么他们都将被判监半年。

如果两个人都检举对方,那么他们都将被判监2年。

在这个博弈中,每个参与者都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。

参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。

另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。

那么,囚徒应该选择哪种策略才能将自己的刑期缩短到最短呢?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。

就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。

因此,两个理性的囚徒都会选择背叛,这是两种策略中的支配性策略。

因此,这场博弈中唯一可能达到的纳什均衡,就是双方都背叛对方,结果二人同样服刑2年。

在博弈论中,智猪博弈是一个著名的例子。

猪圈里有一头大猪和一头小猪,猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮。

按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本。

若大猪先到槽边,大小猪吃到食物的收益比是9∶1;同时到槽边,收益比是7∶3;小猪先到槽边,收益比是6∶4.在两头猪都有智慧的前提下,最终结果是小猪选择等待。

实际上,小猪选择等待,让大猪去按控制按钮,而自己选择“坐船”或搭便车的原因很简单:在大猪选择行动的前提下,小猪也行动的话,小猪可得到1个单位的纯收益,而小猪等待的话,则可以获得4个单位的纯收益,等待优于行动;在大猪选择等待的前提下,小猪如果行动的话,小猪的收入将不抵成本,纯收益为-1单位,如果小猪也选择等待的话,那么小猪的收益为零,成本也为零,总之,等待还是要优于行动。

博弈论习题答案

博弈论习题答案

博弈论习题答案博弈论习题答案博弈论是一门研究决策和策略的数学分支,它通过分析参与者之间的互动,揭示他们的利益和行为模式。

在博弈论中,常常会遇到各种各样的习题,这些习题旨在让我们思考和解决实际生活中的决策问题。

本文将给出一些常见的博弈论习题的答案,帮助读者更好地理解和应用博弈论的概念。

1. 零和博弈问题零和博弈是指参与者的利益完全相反,一方的收益等于另一方的损失。

考虑以下情景:两个商人A和B在市场上销售相同的产品,他们的利润取决于他们的定价策略。

如果A的定价高于B,那么B将失去一部分市场份额,反之亦然。

假设A和B的收益函数分别为R_A(p_A, p_B)和R_B(p_A, p_B),其中p_A和p_B分别是A和B的定价。

问题是,A和B应该如何定价以最大化自己的利润?答案:由于这是一个零和博弈问题,A和B的利益完全相反。

因此,他们的最佳策略是采取纳什均衡策略。

纳什均衡是指在互动中,没有参与者能够通过改变自己的策略来提高自己的收益。

在这个例子中,纳什均衡定价是使得A和B的利润最大化的定价组合。

通过求解收益函数的偏导数,我们可以找到纳什均衡定价。

2. 合作与背叛在博弈论中,合作与背叛是一个经典的主题。

考虑以下情景:两个犯罪团伙A和B同时被捕,他们面临着与检察官合作还是背叛的选择。

如果两个团伙都选择合作,那么他们将面临较轻的刑罚;如果一个团伙选择合作而另一个团伙选择背叛,那么合作的团伙将面临较重的刑罚,而背叛的团伙将面临较轻的刑罚;如果两个团伙都选择背叛,那么他们将面临较重的刑罚。

问题是,A和B应该如何决策以最大化自己的利益?答案:这是一个经典的囚徒困境问题,合作是最佳策略。

在囚徒困境中,纳什均衡是使得参与者无法通过改变自己的策略来提高自己的收益。

在这个例子中,如果A和B都选择合作,他们将获得较轻的刑罚。

然而,如果一个团伙选择背叛而另一个团伙选择合作,背叛的团伙将获得更轻的刑罚,而合作的团伙将获得更重的刑罚。

博弈论智力题

博弈论智力题

A.逻辑推理2、请把一盒蛋糕切成8 份,分给8个人,但蛋糕盒里还必须留有一份。

3、小明一家过一座桥,过桥时是黑夜,所以必须有灯。

现在小明过桥要 1 秒,小明的弟弟要3 秒,小明的爸爸要6 秒,小明的妈妈要8 秒,小明的爷爷要12 秒。

每次此桥最多可过两人,而过桥的速度依过桥最慢者而定,而且灯在点燃后30 秒就会熄灭。

问:小明一家如何过桥?4、一群人开舞会,每人头上都戴着一顶帽子。

帽子只有黑白两种,黑的至少有一顶。

每个人都能看到其他人帽子的颜色,却看不到自己的。

主持人先让大家看看别人头上戴的是什么帽子,然后关灯,如果有人认为自己戴的是黑帽子,就打自己一个耳光。

第一次关灯,没有声音。

于是再开灯,大家再看一遍,关灯时仍然鸦雀无声。

一直到第三次关灯,才有劈劈啪啪打耳光的声音响起。

问有多少人戴着黑帽子?5、请估算一下CN TOWER电视塔的质量。

7、U2 合唱团在17分钟内得赶到演唱会场,途中必需跨过一座桥,四个人从桥的同一端出发,你得帮助他们到达另一端,天色很暗,而他们只有一只手电筒。

次同时最多可以有两人一起过桥,而过桥的时候必须持有手电筒,所以就得有人把手电筒带来带去,来回桥两端。

手电筒是不能用丢的方式来传递的。

四个人的步行速度各不同,若两人同行则以较慢者的速度为准。

Bono需花1分钟过桥,Edge需花2 分钟过桥,Adam 需花5 分钟过桥,Larry 需花10 分钟过桥。

他们要如何在17 分钟内过桥呢?11、有7克、2克砝码各一个,天平一只,如何只用这些物品三次将140克的盐分成50、90 克各一份?13、你有两个罐子,50个红色弹球,50 个蓝色弹球,随机选出一个罐子,随机选取出一个弹球放入罐子,怎么给红色弹球最大的选中机会?在你的计划中,得到红球的准确几率是多少?14、想象你在镜子前,请问,为什么镜子中的影像可以颠倒左右,却不能颠倒上下?16、如果你有无穷多的水,一个3 夸脱的和一个5 夸脱的提桶,你如何准确称出4 夸脱的水?21、假设一张圆盘像唱机上的唱盘那样转动。

博弈论十五道题以及答案

博弈论十五道题以及答案

博弈论十五道题以及答案1.博弈理论在哪些方面扩展了传统的新古典经济学?2.法律和信誉是维持市场有序运行的两个基本机制。

请结合重复博弈理论谈谈信誉机制发生作用的几个条件。

3.经济发展史表明,在本来不认识的人之间建立相互之间的信任关系是经济发展的关键。

为什么?4.在传统社会中,即使没有法律,村民之间也可以建立起高度的信任。

请结合博弈理论解释其原因。

5.在旅游地很容易出现假货,而在居民小区的便利店则很少出现假货,请结合博弈论的相关理论进行解释。

6.你如何理解“Credible threats or promises about future behavior can influence current behavior”这句话的?7.有效的法律制度对经济发展具有什么作用?请结合博弈理论谈谈你的理解。

8.试用博弈理论解释家族企业为什么难以实行制度化管理?9.固定资产投资为什么可以作为一种可置信的承诺?10.以汽车保险为例谈谈因为信息不对称所可能产生的道德风险问题,并提出一种解决道德风险的方案。

11.以公司为例,谈谈所有者与经营者的分离可能产生的道德风险问题。

12.在波纳佩岛上,谁能种出特别大的山药,谁的社会地位就高,谁就能赢得人们的尊敬并可担任公共职务。

请结合信号传递模型谈谈波纳佩岛上的这种奇异风俗。

13.一位男生在女朋友过生日时送给女朋友三百元人民币,他的女朋友往往感觉受到了侮辱。

而他女朋友可能会欣然接受父母亲的现金礼物。

请解释其中可能的原因。

14.<圣经>(旧约)中记载了两个母亲争夺一个孩子的故事。

一次,两个女人为争夺一个婴儿争扯到所罗门王殿前,她们都说婴儿是自己的,请所罗门王作主。

所罗门王稍加思考后作出决定:将婴儿一刀劈为两段,两位妇人各得一半。

这时,其中一位妇人立即要求所罗门王将婴儿判给对方,并说婴儿不是自己的,应完整归还给另一位妇人,千万别将婴儿劈成两半。

听罢这位妇人的求诉,所罗门王立即作出最终裁决——婴儿是这位请求不杀婴儿的妇人的,应归于她。

(完整word版)经典的博弈论分析案例——“海盗分金”问题

(完整word版)经典的博弈论分析案例——“海盗分金”问题

经典的博弈论分析案例——“海盗分金”问题5个海盗抢得100枚金币,他们按抽签的顺序依次提方案:首先由1号提出分配方案,然后5人表决,超过半数同意方案才被通过,否则他将被扔入大海喂鲨鱼,依此类推。

“海盗分金”其实是一个高度简化和抽象的模型,体现了博弈的思想。

在“海盗分金”模型中,任何“分配者”想让自己的方案获得通过的关键是事先考虑清楚“挑战者”的分配方案是什么,并用最小的代价获取最大收益,拉拢“挑战者”分配方案中最不得意的人们。

假设前提假定“每个海盗都是绝顶聪明且很理智”,那么“第一个海盗提出怎样的分配方案才能够使自己的收益最大化?”推理过程从后向前推,如果1至3号强盗都喂了鲨鱼,只剩4号和5号的话,5号一定投反对票让4号喂鲨鱼,以独吞全部金币。

所以,4号惟有支持3号才能保命。

3号知道这一点,就会提出(100,0,0)的分配方案,对4号、5号一毛不拔而将全部金币归为已有,因为他知道4号一无所获但还是会投赞成票,再加上自己一票,他的方案即可通过。

不过,2号推知3号的方案,就会提出(98,0,1,1)的方案,即放弃3号,而给予4号和5号各一枚金币。

由于该方案对于4号和5号来说比在3号分配时更为有利,他们将支持他而不希望他出局而由3号来分配。

这样,2号将拿走98枚金币。

同样,2号的方案也会被1号所洞悉,1号并将提出(97,0,1,2,0)或(97,0,1,0,2)的方案,即放弃2号,而给3号一枚金币,同时给4号(或5号)2枚金币。

由于1号的这一方案对于3号和4号(或5号)来说,相比2号分配时更优,他们将投1号的赞成票,再加上1号自己的票,1号的方案可获通过,97枚金币可轻松落入囊中。

这无疑是1号能够获取最大收益的方案了!答案是:1号强盗分给3号1枚金币,分给4号或5号强盗2枚,自己独得97枚。

分配方案可写成(97,0,1,2,0)或(97,0,1,0,2)。

分析1号看起来最有可能喂鲨鱼,但他牢牢地把握住先发优势,结果不但消除了死亡威胁,还收益最大。

博弈论复习题及答案DOC

博弈论复习题及答案DOC

可口可乐与百事可乐(参与者)的价格决策:双方都可以保持价格不变或者提高价格(策略);博弈的目标和得失情况体现为利润的多少(收益);利润的大小取决于双方的策略组合(收益函数);博弈有四种策略组合,其结局是:(1)双方都不涨价,各得利润10单位;(2)可口可乐不涨价,百事可乐涨价,可口可乐利润100,百事可乐利润-30;(3)可口可乐涨价,百事可乐不涨价,可口可乐利润-20,百事可乐利润30;(4)双方都涨价,可口可乐利润140,百事可乐利润35;画出两企业的损益矩阵求纳什均衡。

9、北方航空公司和新华航空公司分享了从北京到南方冬天度假胜地的市场。

如果它们合作,各获得500000元的垄断利润,但不受限制的竞争会使每一方的利润降至60000元。

如果一方在价格决策方面选择合作而另一方却选择降低价格,则合作的厂商获利将为零,竞争厂商将获利900000元。

(1)将这一市场用囚徒困境的博弈加以表示。

(2)解释为什么均衡结果可能是两家公司都选择竞争性策略。

答:(1)用囚徒困境的博弈表示如下表:(2)如果新华航空公司选择竞争,则北方航空公司也会选择竞争(60000>0);若新华航空公司选择合作,北方航空公司仍会选择竞争(900000>500000)。

若北方航空公司选择竞争,新华航空公司也将选择竞争(60000>0);若北方航空公司选择合作,新华航空公司仍会选择竞争(900000>0)。

由于双方总偏好竞争,故均衡结果为两家公司都选择竞争性策略,每一家公司所获利润均为600000元。

12、设啤酒市场上有两家厂商,各自选择是生产高价啤酒还是低价啤酒,相应的利润(单位:万元)由下图的得益矩阵给出:(1)有哪些结果是纳什均衡?(2)两厂商合作的结果是什么?答(1)(低价,高价),(高价,低价)(2)(低价,高价)13、A、B两企业利用广告进行竞争。

若A、B两企业都做广告,在未来销售中,A企业可以获得20万元利润,B企业可获得8万元利润;若A企业做广告,B企业不做广告,A企业可获得25万元利润,B企业可获得2万元利润;若A企业不做广告,B企业做广告,A企业可获得10万元利润,B企业可获得12万元利润;若A、B两企业都不做广告,A企业可获得30万元利润,B企业可获得6万元利润。

博弈论03 典型问题2

博弈论03 典型问题2

博弈论智猪博弈智猪博弈智猪博弈说明在市场竞争中,一个占主导地位的大公司和一个较小的竞争对手之间,可能出现同生共存的均衡结局。

能否出现这种均衡,取决于竞争双方对自己在竞争中的地位和做法是否有一个清醒的认识,能否认清自己的真正利益所在,最终避免发生残酷的价格战,两个地位相去甚远的对手达成和平共处的生存模式。

智猪博弈智猪博弈说明在市场竞争中,一个占主导地位的大公司和一个较小的竞争对手之间,可能出现同生共存的均衡结局。

能否出现这种均衡,取决于竞争双方对自己在竞争中的地位和做法是否有一个清醒的认识,能否认清自己的真正利益所在,最终避免发生残酷的价格战,两个地位相去甚远的对手达成和平共处的生存模式。

游戏规则的重要性智猪博弈模型在应用中也不断被改进。

例如有学者认为“小猪躺着大猪跑”的现象是由于智猪博弈的游戏规则所导致的。

规则的核心指标是每次落下的食物量和踏板与食槽之间的距离。

游戏规则的重要性智猪博弈模型在应用中也不断被改进。

例如有学者认为“小猪躺着大猪跑”的现象是由于智猪博弈的游戏规则所导致的。

规则的核心指标是每次落下的食物量和踏板与食槽之间的距离。

游戏规则的重要性智猪博弈模型在应用中也不断被改进。

例如有学者认为“小猪躺着大猪跑”的现象是由于智猪博弈的游戏规则所导致的。

规则的核心指标是每次落下的食物量和踏板与食槽之间的距离。

反用智猪博弈智猪博弈的结论是从小猪立场考虑的最佳选择,认为小猪应耐心等待大猪去踩踏板,才能获得生存发展的机会。

而站在大猪立场上,均衡结果不是理想结果。

如果大猪能运用策略诱使小猪作出有利于大猪自己的决策,学界称为“新智猪博弈”。

反用智猪博弈智猪博弈的结论是从小猪立场考虑的最佳选择,认为小猪应耐心等待大猪去踩踏板,才能获得生存发展的机会。

而站在大猪立场上,均衡结果不是理想结果。

如果大猪能运用策略诱使小猪作出有利于大猪自己的决策,学界称为“新智猪博弈”。

反用智猪博弈智猪博弈的结论是从小猪立场考虑的最佳选择,认为小猪应耐心等待大猪去踩踏板,才能获得生存发展的机会。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

几个博弈论中的经典问题博弈论(Game Theory),亦名“对策论”、“赛局理论”,属应用数学的一个分支,博弈论已经成为经济学的标准分析工具之一。

目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。

博弈论主要研究公式化了的激励结构间的相互作用。

是研究具有斗争或竞争性质现象的数学理论和方法。

也是运筹学的一个重要学科。

博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。

生物学家使用博弈理论来理解和预测进化论的某些结果。

几个重要的概念1、策略(strategies):一局博弈中,每个局中人都有选择实际可行的完整的行动方案,即方案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局中人的一个可行的自始至终全局筹划的一个行动方案,称为这个局中人的一个策略。

如果在一个博弈中局中人都总共有有限个策略,则称为“有限博弈”,否则称为“无限博弈”。

2、得失(payoffs):一局博弈结局时的结果称为得失。

每个局中人在一局博弈结束时的得失,不仅与该局中人自身所选择的策略有关,而且与全局中人所取定的一组策略有关。

所以,一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数,通常称为支付(payoff)函数。

3、次序(orders):各博弈方的决策有先后之分,且一个博弈方要作不止一次的决策选择,就出现了次序问题;其他要素相同次序不同,博弈就不同。

4、博弈涉及到均衡:均衡是平衡的意思,在经济学中,均衡意即相关量处于稳定值。

在供求关系中,某一商品市场如果在某一价格下,想以此价格买此商品的人均能买到,而想卖的人均能卖出,此时我们就说,该商品的供求达到了均衡。

5、纳什均衡(Nash Equilibrium):在一策略组合中,所有的参与者面临这样一种情况,当其他人不改变策略时,他此时的策略是最好的。

也就是说,此时如果他改变策略他的支付将会降低。

在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。

纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。

所谓“均衡偶”是在二人零和博弈中,当局中人A采取其最优策略a*,局中人B也采取其最优策略b*,如果局中人B仍采取b*,而局中人A却采取另一种策略a,那么局中人A 的支付不会超过他采取原来的策略a*的支付。

这一结果对局中人B亦是如此。

经典的博弈问题1、“囚徒困境”“囚徒困境”是博弈论里最经典的例子之一。

讲的是两个嫌疑犯(A和B)作案后被警察抓住,隔离审讯;警方的政策是"坦白从宽,抗拒从严",如果两人都坦白则各判8年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白则因证据不足各判1年。

在这个例子里,博弈的参加者就是两个嫌疑犯A和B,他们每个人都有两个策略即坦白和不坦白,判刑的年数就是他们的支付。

可能出现的四种情况:A和B均坦白或均不坦白、A坦白B不坦白或者B坦白A不坦白,是博弈的结果。

A和B均坦白是这个博弈的纳什均衡。

这是因为,假定A选择坦白的话,B最好是选择坦白,因为B坦白判8年而抵赖却要判十年;假定A选择抵赖的话,B最好还是选择坦白,因为B坦白判不被判刑而抵赖确要被判刑1年。

即是说,不管A坦白或抵赖,B的最佳选择都是坦白。

反过来,同样地,不管B是坦白还是抵赖,A的最佳选择也是坦白。

结果,两个人都选择了坦白,各判刑8年。

在(坦白、坦白)这个组合中,A和B都不能通过单方面的改变行动增加自己的收益,于是谁也没有动力游离这个组合,因此这个组合是纳什均衡。

囚徒困境反映了个人理性和集体理性的矛盾。

如果A和B都选择抵赖,各判刑1年,显然比都选择坦白各判刑8年好得多。

当然,A和B可以在被警察抓到之前订立一个"攻守同盟",但是这可能不会有用,因为它不构成纳什均衡,没有人有积极性遵守这个协定。

2、海盗分金币问题在一座座荒岛上,有5个强盗掘出了100块非常珍贵的金币。

他们商定了一个分配金币的规则:首先抽签决定每个人的次序,排列成强盗一至五。

然后由强盗一先提出分配方案,经5人表决,如多数人同意,方案就被通过,否则强盗一将被扔入大海喂鲨鱼。

如果强盗一被扔入大海,就由强盗二接着提出分配方案,如多数人同意方案就被通过,否则强盗二也要被扔入大海。

以下依次类推。

假定每个强盗都足够聪明,都能做出理性的选择,那么,强盗一提出什么样的分配方案,能够使自己得到最大的收益?对于这个问题要采用方向推导方法:如果1至3号强盗都喂了鲨鱼,只剩4号和5号的话,5号一定投反对票让4号喂鲨鱼,以独吞全部金币。

所以,4号惟有支持3号才能保命。

3号知道这一点,就会提出“100,0,0”的分配方案,对4号、5号一毛不拔而将全部金币归为已有,因为他知道4号一无所获但还是会投赞成票,再加上自己一票,他的方案即可通过。

不过,2号推知3号的方案,就会提出“98,0,1,1”的方案,即放弃3号,而给予4号和5号各一枚金币。

由于该方案对于4号和5号来说比在3号分配时更为有利,他们将支持他而不希望他出局而由3号来分配。

这样,2号将拿走98枚金币。

同样,2号的方案也会被1号所洞悉,1号并将提出(97,0,1,2,0)或(97,0,1,0,2)的方案,即放弃2号,而给3号一枚金币,同时给4号(或5号)2枚金币。

由于1号的这一方案对于3号和4号(或5号)来说,相比2号分配时更优,他们将投1号的赞成票,再加上1号自己的票,1号的方案可获通过,97枚金币可轻松落入囊中。

这无疑是1号能够获取最大收益的方案了!答案是:1号强盗分给3号1枚金币,分给4号或5号强盗2枚,自己独得97枚。

分配方案可写成(97,0,1,2,0)或(97,0,1,0,2)。

1号看起来最有可能喂鲨鱼,但他牢牢地把握住先发优势,结果不但消除了死亡威胁,还收益最大。

而5号,看起来最安全,没有死亡的威胁,甚至还能坐收渔人之利,却因不得不看别人脸色行事而只能分得一小杯羹。

在“海盗分金”中,任何“分配者”想让自己的方案获得通过的关键是,事先考虑清楚“挑战者”的分配方案是什么,并用最小的代价获取最大收益,拉拢“挑战者”分配方案中最不得意的人们。

3、旅行者困境两个旅行者从一个以出产细瓷花瓶著称的地方旅行回来,他们都买了花瓶。

提取行李的时候,发现花瓶被摔坏了,于是他们向航空公司索赔。

航空公司知道花瓶的价格大概在八九十元的价位浮动,但是不知道两位旅客买的时候的确切价格是多少。

于是,航空公司请两位旅客在100元以内自己写下花瓶的价格。

如果两人写的一样,航空公司将认为他们讲真话,就按照他们写的数额赔偿;如果两人写的不一样,航空公司就认定写得低的旅客讲的是真话,并且原则上按这个低的价格赔偿,同时,航空公司对讲真话的旅客奖励2元,对讲假话的旅客罚款2元。

为了获取最大赔偿而言,本来甲乙双方最好的策略,就是都写100元,这样两人都能够获赔100元。

可是不,甲很聪明,他想:如果我少写1元变成99元,而乙会写100元,这样我将得到101元。

何乐而不为?所以他准备写99元。

可是乙更聪明,他算计到甲要算计他写99元,于是他准备写98元。

想不到甲还要更聪明一个层次,估计到乙要写98元来坑他,于是他准备写97元……大家知道,下象棋的时候,不是说要多“看”几步吗,“看”得越远,胜算越大。

你多看两步,我比你更强多看三步,你多看四步,我比你更老谋深算多看五步。

在花瓶索赔的例子中,如果两个人都“彻底理性”,都能看透十几步甚至几十步上百步,那么上面那样“精明比赛”的结果,最后落到每个人都只写一两元的地步。

事实上,在彻底理性的假设之下,这个博弈唯一的纳什均衡。

4、枪手博弈彼此痛恨的甲、乙、丙三个枪手准备决斗。

甲枪法最好,十发八中;乙枪法次之,十发六中;丙枪法最差,十发四中。

如果三人同时开枪,并且每人只发一枪;第一轮枪战后,谁活下来的机会大一些?一般人认为甲的枪法好,活下来的可能性大一些。

但合乎推理的结论是,枪法最糟糕的丙活下来的几率最大。

我们来分析一下各个枪手的策略。

枪手甲一定要对枪手乙先开枪。

因为乙对甲的威胁要比丙对甲的威胁更大,甲应该首先干掉乙,这是甲的最佳策略。

同样的道理,枪手乙的最佳策略是第一枪瞄准甲。

乙一旦将甲干掉,乙和丙进行对决,乙胜算的概率自然大很多。

枪手丙的最佳策略也是先对甲开枪。

乙的枪法毕竟比甲差一些,丙先把甲干掉再与乙进行对决,丙的存活概率还是要高一些。

我们计算一下三个枪手在上述情况下第一轮枪战中的存活几率:甲:24%(被乙丙合射40% X 60% = 24%)乙:20%(被甲射100% - 80% = 20%)丙:100%(无人射丙)第二轮枪战中甲乙丙存活的几率粗算如下:(1) 假设甲丙对决:甲的存活率为60%,丙的存活率为20%。

(2) 假设乙丙对决:乙的存活率为60%,丙的存活率为40%。

第一轮:甲射乙,乙射甲,丙射甲。

甲的活率为24%(40% X 60%),乙的活率为20%(100% - 80%),丙的活率为100%(无人射丙)。

第二轮:情况1:甲活乙死(24% X 80% = 19.2%)甲射丙,丙射甲──甲的活率为60%,丙的活率为20%。

情况2:乙活甲死(20% X 76% = 15.2%)乙射丙,丙射乙──乙的活率为60%,丙的活率为40%。

情况3:甲乙皆活(24% X 20% = 4.8%)重复第一轮。

情况4:甲乙皆死(76% X 80% = 60.8%)枪战结束。

甲的活率为12.672%(19.2% X 60%) + (4.8% X 24%) = 12.672%乙的活率为10.08%(15.2% X 60%) + (4.8% X 20%) = 10.08%丙的活率为75.52%(19.2% X 20%) + (15.2% X 40%) + (4.8% X 100%) + (60.8% X 100%) = 75.52%通过对两轮枪战的详细概率计算,我们仍然发现枪法最差的丙存活的几率最大,枪法较好的甲和乙的存活几率仍远低于丙的存活几率。

对于这样的例子,有人会发出“英雄创造历史,庸人繁衍子孙”的感叹。

相关文档
最新文档