海盗博弈论
博弈论之群盗逻辑

残暴群盗的逻辑
示例;
10个海盗抢到100颗宝石,每一颗大小相等且价值连城。
他们决定这么分;
1.抽签决定自己的号码(1,2,3,4,5,6,7,8,9,10).
2.首先由1号提出分配方案,然后10人进行表决,当且仅当超过半
数的人同意时,按照他的提案进行分配,否则将被扔进大海喂鲨鱼。
3.如果1号死了,再由2号提出方案,然后大家就9人进行表决,
当且仅当超过半数人同意时,按照他的提案进行分配,否则就被扔进大海喂鲨鱼。
4.以此类推……
条件;
●每个海盗都是高度理性的人,都很能力值得把握全局,判断得
失,从而做出选择。
需要说明一点的是,海盗间私底下的交易
是不存在的,因为海盗除了自己谁都不相信。
●每个海盗当然希望自己能得到尽可能多的宝石。
●每个海盗当然不愿意自己被丢进海里去喂鲨鱼,这是最重要
的。
同时,每个海盗都很喜欢其他海盗被丢进海里去喂鱼。
在
不损害自己利益的前提下,他会尽可能投票让自己的同伴喂
鱼。
●一颗宝石是不能分割的,不可以你半颗我半颗。
每个海盗的序号不同,而且所有的海盗都知道别人的序号,也就是说,每个人都知道自己和别人在这个提出方案的序列中的位置。
问题:
第一个海盗提出怎样的分配方案才能够使自己的利益最大化?。
(完整word版)经典的博弈论分析案例——“海盗分金”问题

经典的博弈论分析案例一一“海盗分金”问题5个海盗抢得100枚金币,他们按抽签的顺序依次提方案:首先由1号提出分配方案,然后5人表决,超过半数同意方案才被通过,否则他将被扔入大海喂鲨鱼,依此类推。
“海盗分金”其实是一个高度简化和抽象的模型,体现了博弈的思想。
在“海盗分金”模型中,任何“分配者”想让自己的方案获得通过的关键是事先考虑清楚“挑战者”的分配方案是什么,并用最小的代价获取最大收益,拉拢“挑战者”分配方案中最不得意的人们。
假设前提假定“每个海盗都是绝顶聪明且很理智”,那么“第一个海盗提出怎样的分配方案才能够使自己的收益最大化?” 推理过程从后向前推,如果1至3号强盗都喂了鲨鱼,只剩4号和5号的话,5号一定投反对票让4号喂鲨鱼,以独吞全部金币。
所以,4号惟有支持3号才能保命。
3号知道这一点,就会提出(100,0,0)的分配方案,对4号、5号一毛不拔而将全部金币归为已有,因为他知道4号一无所获但还是会投赞成票,再加上自己一票,他的方案即可通过。
不过,2号推知3号的方案,就会提出(98,0,1,1)的方案,即放弃3 号,而给予4号和5号各一枚金币。
由于该方案对于4号和5号来说比在3号分配时更为有利,他们将支持他而不希望他出局而由3号来分配。
这样,2号将拿走98枚金币。
同样,2号的方案也会被1号所洞悉,1号并将提出(97, 0,1, 2, 0)或(97, 0,1, 0,2)的方案,即放弃2号,而给3号一枚金币,同时给4号(或5号)2枚金币。
由于1号的这一方案对于3号和4号(或5号)来说,相比2号分配时更优,他们将投1号的赞成票,再加上1号自己的票,1号的方案可获通过,97枚金币可轻松落入囊中。
这无疑是1号能够获取最大收益的方案了!答案是:1号强盗分给3号1枚金币,分给4号或5号强盗2枚,自己独得97枚。
分配方案可写成(97, 0, 1, 2, 0)或(97, 0, 1, 0, 2)。
分析1号看起来最有可能喂鲨鱼,但他牢牢地把握住先发优势,结果不但消除了死亡威胁,还收益最大。
【博弈论】海盗分金问题

【博弈论】海盗分⾦问题HDU 1538 A Puzzle for Pirates这是⼀个经典问题,有n个海盗,分m块⾦⼦,其中他们会按⼀定的顺序提出⾃⼰的分配⽅案,如果50%或以上的⼈赞成,则⽅案通过,开始分⾦⼦,如果不通过,则把提出⽅案的扔到海⾥,下⼀个⼈继续。
现在给出n,问第k个海盗(第n个海盗先提⽅案,第1个最后提⽅案)可以分到多少⾦⼦,还是会被扔到海⾥去。
⾸先我们讲⼀下海盗分⾦决策的三个标准:保命,拿更多的⾦⼦,杀⼈,优先级是递减的。
同时分为两个状态稳定状态和不稳定状态:如果当n和m的组合使得最先决策的⼈(编号为n)不会被丢下海, 即游戏会⽴即结束, 就称这个状态时"稳定的". 反之, 问题会退化为n-1和m的组合, 直到达到⼀个稳定状态, 所以称这种状态为"不稳定的".接下来我们从简单的开始分析:如果只有两个⼈的话:那么2号开始提出⽅案,这时候知道不管提什么,他⾃⼰肯定赞成,⼤于等于半数,⽅案通过,那么2号肯定把所有的⾦⼦都给了⾃⼰。
如果只有三个⼈的话:那么3号知道,如果⾃⼰死了,那么2号肯定能把所有⾦⼦拿下,对于1号来说没有半点好处。
那么他就拿出⾦⼦贿赂1号,1号拿到1个⾦⼦,总⽐没有好,肯定赞成3号,剩下的3号拿下。
如果只有四个⼈的话:那么4号知道,如果⾃⼰死了,那么1号拿到1个⾦⼦,2号什么都没有,3号拿下剩下的⾦⼦。
那他就可以拿出部分⾦⼦贿赂2号,2号知道如果4号死了,⾃⼰将什么都没有,他肯定赞成4号。
如此类推下去,如果n<=2*m时候,前⾯与n相同奇偶性的得到1个⾦⼦,剩下的第n个⼈全部拿下。
但是会有⼀个问题便是,如果⾦⼦不够贿赂怎么办:我们将问题具体化:如果有500个海盗,只有100个⾦⼦,那么前⾯200个已经分析过了。
对于201号来说,拿出100个⾦⼦贿赂前⾯的第200号分⾦⼦时拿不到⾦⼦的100个⼈。
⾃⼰不拿⾦⼦,这样刚好有101票保证⾃⼰不死,如果分给之前能拿到⾦⼦的⼈,那么之前拿不到⾦⼦的⼈反正⽆论如何也拿不到⾦⼦,不如把你杀了。
海盗分金博弈论的故事

海盗分金博弈论的故事海盗分金--博弈论的故事(一)海盗分金5名海盗分100枚金币。
规则是大家抽签分出1-5号,并按顺序提方案。
1号首先提方案,5人表决,当超半数同意时有效;否则1号将被抛入大海。
然后,2号提方案,4人表决,评判方式同上。
以此类推。
假定每个人都很聪明,1号提出什么方案,能使自己收益最大?答案是:(97、0、1、0、2)或(97、0、1、2、0)。
推理:假定1-3号都抛入大海,那末4号也活不了,所以,4号必须保住3号。
据此,3号可提方案(100、0、0)。
2号推知3号方案,可提出(98、0、1、1)方案,来拉拢4号和5号。
1号推知2号方案,可推出上述方案,拉拢住3号,以及4号或5号中的1人。
(二)博弈论与博弈类型博弈(Game),本是游戏、竞赛的意思。
所要解决的核心问题是:参与博弈的其他人员会怎么做?我应采取怎样的对策来取得最佳效果?博弈的例子到处可见:讨价还价、划拳、小孩猜拳、下棋、打牌,以及"三十六计"、"田忌赛马"等。
博弈论作为一种理论,最先是由美国经济学家冯·诺伊曼在1937年提出来的,他与经济学家奥斯卡·摩根斯坦于1944年合著的《博弈论与经济行为》公认为博弈论诞生的标志。
今天,博弈论已为数学的一个较为完善的分支,并在许多领域被运用。
在经济学领域的影响被称为"现代经济学的一次大的革命"。
博弈类型:1.静态博弈与动态博弈。
前者指参与者同时行动、同时出牌或亮招,如招标、考试等;后者指参与者的行动有先后次序,如下棋、战争、商业竞争等。
2.完全信息博弈与不完全信息博弈。
前者指参与者互相都"知己知彼",否则就是后者。
3.零和博弈与非零和博弈。
前者指"你赢的就是我输的",如打麻将、下棋等;后者指大家的得失总和不为零,如势均力敌的战争会使两败俱伤,而商业合作会使"双赢"。
海盗分金博弈

方案。
海盗分金策略:海盗们需要根据自己和其他海盗的等级、
02
人数、分配方案等因素,制定出最优的分配方案,以获得
最大的收益。
03
海盗分金博弈:海盗们需要在博弈过程中,根据其他海盗 的行为和决策,调整自己的策略,以实现最优的分配方案。
04
海盗分金策略的优化:海盗们可以通过合作、沟通等方式, 优化自己的策略,以实现更高的收益。
参与者角色
2019
船长:海盗的 头领,负责分
配金条
2021
旁观者:观察海 盗分金的过程,
不参与决策
01
02
海盗:参与分 金的主要角色,
有决策权
2020
03
04
船员:海盗的 成员,服从船
长的命令
2022
博弈目标
01
海盗分金:每个 海盗都希望获得 尽可能多的金币
02
公平分配:每个 海盗都希望分配
方案公平合理
博弈的结果取决于参与者 的策略选择,不同的策略 选择会导致不同的结果。
参与者需要根据对方的策 略选择来调整自己的策略, 以实现最优的结果。
博弈的结果分析可以帮助 我们更好地理解博弈论的 基本原理和应用场景。
博弈最优解
01
海盗分金博弈: 一种多人参与 的博弈游戏
02
博弈结果:参 与者根据策略 选择,获得不 同的收益
03
避免冲突:每个 海盗都希望避免 与其他海盗发生
冲突
04
生存优先:每个 海盗都希望在分 金过程中保证自
己的生存
2 博弈策略
海盗分金策略
海盗分金规则:海盗按照等级从高到低依次提出分配方案,
01
如果方案被半数以上海盗同意,则按照该方案分配;否则, 提出方案的海盗将被扔进大海,然后由下一位海盗提出新的
博弈论

海盗分赃
假设这5个海盗都贪婪成性、残忍无比、绝顶聪明而又一诺千 金,都想自己得到最多,都想看到别人死去而自己存活。 请问,最后的分配结果是什么? 正确答案是:1号分配,依次是:97,0,1,0,2或者是: 97,0,1,2,0。
分配方案 1 2 3 4 1号 2号 97 0 98 3号 1 0 99 4号 5号
四、创新营销方式,扩大市场份额。 首先,创新营销观念,这是企业营销创新的核心和前提。 举个例子:《英雄》:一部糟糕电影的辉煌纪录。
弱智的故事情节、失真的动作设计、装腔作势的台词,这部糟糕的 电影,却取得了中国电影市场最成功的票房,上市20天就创下了超过2 亿元的票房,而同年度风靡全球的《哈利·伯特》,在中国创下的票房 仅为6300万元。 让《英雄》成功的,不是电影本身,而是营销策划、市场推广的创 新。《英雄》组成了阵容强大的明星剧组,借助团队的明星效应,持续 制造新闻。以令人赞叹的耐心、丝丝相扣的营销策划和长达2年的新闻 公关,位列同年度十大营销创新案例之首。《英雄》所获得空前成功, 也把电影营销策略和营销组织性推进到了前所未有的程度。
0(2) 2(0) 1(2) 1(0) 0 100 1 0
海盗分赃
这个需要倒着来分析,先说4、5号。如果仅仅剩下这两人。4 号肯定选择100:0这个提案,因为即使5号不同意,按照规则,4号 自己同意自己的提案,也算达到半数,所以,5号看似被动,其实 非常主动,因为他可以冷眼旁观前三个人的提案,根据是否对自己 有利的原则来选择是否同意。也就是说,5号肯定不会等到4号来表 决,他必须支持前三个提案中,给自己最多的一个提案,因为到了 4号提案的时候,他肯定什么也得不到。 可以推导到3号,如果3号选择给自己99个,4号0个,5号1个, 那么5号就不得不同意了,因为这样他至少能得到一个,比最后由4 号提案,他什么都得不到强。也就是说,轮到3号提案,他肯定是 提交99:0:1这个提案。那么也就是说,如果轮到3号选择,4号肯 定什么都得不到,那么4号最清楚,他要在前二个提案里,选择一 个给自己最多的提案。
博弈论之二:海盗分金

博弈论之二:海盗分金人跟人之间,国家跟国家之间,都要进行博弈,为了增加自己的利益,保护国家的安全,就要动脑经,捉摸对方的想法,“知己知彼,百战不殆”。
博弈论是经济学的新工具,可以帮助我们在生活中识别对手,赢得先机。
之所以说它是一种新的分析问题的工具,是因为过去的经济学,都是基于简单的环境:人与人之间、企业之间不存在相互的影响。
我怎么做,对你不发生影响,你不必考虑我怎么做,同时,我也不用考虑你的反应,大家是“井水不犯河水”。
这显然是有局限的,这个世界是一个整体,谁也离不开谁。
人与人之间,国家之间是相互影响的。
如果美元贬值,对其他国家肯定室友影响的,是否让美元贬值,美国要顾及其他国家的反映。
下棋是博弈,你如何走下一步,要考虑到它对对手的影响,也要考虑到对手如何反击,以及这话总反击对你造成的影响;对手怎么下,也要看你如何走,并且考虑到他的反应对你的影响。
影响是相互的,这是博弈论解决问题的环境。
我们用著名的“海盗分金”的例子,继续讲述博弈论。
故事是这样的:有五个海盗,在海上抢劫了100两金子,他们要分配抢来的金子,办法是“民主”的,盗亦有道。
为了保证每个海盗的利益,分金规则如下。
首先,抓阄,每个阄上有一个数字:1,2,3,4,5,表示的是接下来的次序。
然后,按照上面决定的次序,每个人有权提出一个分配方案,抓到1号阄的人先提议。
然后是抓到2,3,4,5号阄的人提议,最后就是大家表决。
任何一个人,如果他提出分配方案,得到一半以上人同意,就按照他的方案分配金子;如果不能获得一半以上人的同意,这个人就要被杀掉,由下一个人再提出方案,再表决。
以此类推。
我们的假设是,每个海盗都追求自己的利益极大化。
两利相权取其重,两害相权取其轻。
保命肯定是第一考虑,经量避免被杀掉;在此基础上,肯定是自己得到的金子越多越好。
当然,我们也要假定,海盗们非常自觉,任何时候都会遵守规则,绝不会破坏规则。
我们的问题是:如果你是抓到第1号阄的海盗,你的分金方案是什么?一定要仔细想,否则就没命了。
500名海盗分赃问题博弈解

500名海盗分金问题博弈解数学的逻辑有时会导致看来十分怪异的结论。
一般的规则是,如果逻辑推理没有漏洞,那么结论就必定站得住脚,即使它与你的直觉矛盾。
1998年9月,加利福尼亚州帕洛阿尔托的stephen.m.omohundro发表了一道难题,它恰好就属于这一类。
这难题已经流传了至少十年,但是omohundro对它作了改动,使它的逻辑问题变得分外复杂。
先来看看此难题原先的形状。
10名海盗抢得了100颗宝石,并打算瓜分这些战利品。
这是一些讲民主的海盗(当然是他们自己特有的民主),他们的习惯是按下面的方式进行分配:最厉害的一名海盗提出分配方案,然后所有的海盗(包括提出方案者本人)就此方案进行表决。
如果50%或更多的海盗赞同此方案,此方案就获得通过并据此分配战利品。
否则提出方案的海盗将被扔到海里喂鲨鱼,然后下一名最厉害的海盗又重复上述过程。
所有的海盗都乐于看到他们的一位同伙被扔进海里喂鲨鱼,不过,如果让他们选择的话,他们还是宁可得一笔现金。
他们当然也不愿意自己被扔到海里。
所有的海盗都是有理性的,而且知道其他的海盗也是有理性的。
此外,没有两名海盗是同等厉害的--这些海盗按照完全由上到下的等级排好了座次,并且每个人都清楚自己和其他所有人的等级。
这些宝石不能再分,也不允许几名海盗共有宝石,因为任何海盗都不相信他的同伙会遵守关于共享一颗宝石的安排。
这是一伙每人都只为自己打算的海盗。
最凶的一名海盗应当提出什么样的分配方案才能使他获得最多的宝石呢?为方便起见,我们按照这些海盗的怯懦程度来给他们编号。
最怯懦的海盗为1号海盗,次怯懦的海盗为2号海盗,如此类推。
这样最厉害的海盗就应当得到最大的编号,而方案的提出就将倒过来从上至下地进行。
分析所有这类策略游戏的奥妙就在于应当从结尾出发倒推回去。
游戏结束时,你容易知道何种决策有利而何种决策不利。
确定了这一点后,你就可以把它用到倒数第2次决策上,如此类推。
如果从游戏的开头出发进行分析,那是走不了多远的。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
海盗博弈论
Charlesgao发表于2011-06-09 17:39:44
海盗分金是一个非常古老的问题,在1999年《科学美国人》正式把它发表之前,已经至少流行10年了,相信很多人都有所耳闻,也知道解法。
此前死理性派也对这个问题也有所涉及。
今天我们就来回顾一下这个有意思的问题,并且在把问题推广到大规模海盗团伙后,会得出一些非常有意思的结论。
分金的规则
有五个非常聪明的海盗,他们都是死理性派,编号分别是P1、P2、P3、P4、P5。
他们一同抢夺了100个金币,现在需要想办法分配这些金币。
海盗们有严格的等级制度:P1<P2<P3<P4<P5。
海盗们的分配原则是:等级最高的海盗提出一种分配方案。
然后所有的海盗投票决定是否接受分配,包括提议人。
并且在票数相同的情况下,提议人有决定权。
如果提议通过,那么海盗们按照提议分配金币。
如果没有通过,那么提议人将被扔出船外,由下一个最高等级的海盗再提出新的分配方案。
海盗们基于三个因素来做决定。
首先,要能留在船上存活下来。
其次,要使自己的利益最大化(即得到最多的金币)。
最后,在所有其他条件相同的情况下,优先选择把别人扔出船外(这是因为每个海盗都想夺占这条船的控制权)。
海盗的逻辑
现在,假如你是等级最高的P5,你会做何选择?直觉上,为了保住自己的生命,你可能会选择留给自己很少的金币,以便让大家同意自己的决策。
然而,结果和此大相径庭。
解决这个问题的关键在于换个思维方向。
与其苦思冥想你要做什么决策,不如先想想最后剩下的人会做什么决策。
假设现在只剩下P1和P2了,P2会做什么决策?很明显,他将把100金币留给自己,然后投自己一票。
由于在票数相同的情况下提议人有决定权,无论P1同不同意,P2都能毫无危险地将所有金币收入囊中。
现在再把P3考虑进来。
P1知道,如果P3被扔下海,那么游戏就会出现上述的情况,自己终将一无所获。
由于他们都很聪明,P3同样能看到这一点,所以他知道,只要给P1一点点利益,P1就会投票支持他的决策。
所以P3最终的决策应该是:( P3,P2,P1 ) → ( 99,0,1 ) P4的策略也类似:由于他需要50%的支持率,所以他只需贿赂1个金币给P2就可以了。
P2一定会支持他(否则轮到P3做决策,他就一无所获啦)。
所以P4最终的决策是:
( P4,P3,P2,P1 ) → ( 99,0,1,0 )
P5的情况稍有不同:由于这次一共有5个人,他至少需要贿赂两个海盗才能使自己的决议通过。
所以决策就是:( P5,P4,P3,P2,P1 ) → ( 98,0,1,0,1 )
这个结果是不是很出乎意料?你不但可以保全自己,还能得到绝大部分的利益!其实这里面蕴含着递归的思想,它是解决许多问题(如汉诺塔问题,全排列问题,整数划分问题等)的有利手段。
好了,看到这里,想必你一定在感慨:哎,还是做上司(等级高)好啊!且慢!问题还没有结束。
如果有更多的海盗
真实情况下海盗的数目肯定不止5个。
继续按照这个逻辑推理,P6的决策将是:
( P6,P5,P4,P3,P2,P1 ) → ( 98,0,1,0,1,0 )
一直到P200,它会给自己留1个金币,同时给剩下所有偶数编号的海盗1个金币。
如果海盗数是201个,那么P201该怎么做呢?他好像没有足够的钱去贿赂别的海盗了。
不过,为了保住自己的性命,他可以把自己手中的金币全分出去,即给每个奇数编号的海盗(P1~P199)一个金币。
这样虽然空手而归,但不至于人财两空。
如果海盗数是202个,P202也只能把这100个金币全部贿赂给其他100个海盗,而这100个海盗必须是在P201做决策时什么也得不到的海盗。
由于符合这样条件的海盗有101个(所有偶数编号的海盗+P201),P202的决策不再是唯一的!有101种方案供他选择。
可怜的是P203,由于人数众多,他实在没有足够的钱去贿赂其他海盗以获得足够的支持(他至少还需要获得101个人的支持,但只有100个金币)。
所以,不论P203做什么决策,他都难逃被扔出船外的厄运了。
不过P203并没有我们想象中的那么悲剧,除非船上正好有且只有203个海盗。
不妨再来看增加一个海盗P204的情况。
P204明白,P203现在的唯一愿望就是活下来…不论他做什么决策,P203都会举双手支持他(当然举多少手都只能算一
票)。
所以P204可以靠他自己的一票,P203的一票和贿赂另外100个海盗获得正好50%的支持。
P205就没有那么幸运了。
他不能无偿的得到P203和P204的支持。
所以如果轮到P205
做决策,他也必定被扔到船外。
P206也一样,尽管他能得到P205的免费支持,但是这还不够。
P207需要得到至少104个海盗的支持,所以有了P205,P206的无偿支持还是不够。
P208就比较幸运了,他需要得到104个海盗的支持,P205,P206,P207为了保命会无偿支持他,加上他自己,再贿赂100个海盗,正好104票。
到这里我们又看出了新的规律:
从P201之后,在每两个能够作出决策保住自己生命的海盗之间,存在着一些无论如何决策都会被扔到船外的海盗。
而这些海盗会支持在这之后的那个能够做出决策的海盗以保命。
用数学来表达,设在P201之后,能在轮到自己作决策时,保住性命的海盗编号所组成的序列为a(n)。
我们有
a(0)=202 (1)
a(n)-a(n-1)+100= [a(n)/2] (2)
对于(2),
若a(n)是偶数,则a(n)=2a(n-1)-200
若a(n)是奇数,则a(n)=2a(n-1)-199
给定一个固定的初值,数列的下一项有两个可能解:一个奇数解、一个偶数解,且偶数解比奇数解小1。
再考虑我们原问题的意义,当达到偶数解时,偶数编号的海盗已经能够做出决策保全自己。
这说明我们应该舍弃所有奇数解(因为相同情况下,海盗会选择把决策人扔出船外)。
由a(n)=2a(n-1)-200以及a(0)=202,得到通解:a(n)=200+ 2 n+1。
考虑到P201也能保全自己,所以我们把所有能够保全自己但却得不到金币的海盗的编号写成统一表达式:
N=200+ 2 n( n=0,1,2,… )
不难推出这些海盗可能的决策数是在M中任选100的组合数,其中
如果我们都是海盗
好了,我们的海盗分金问题就讨论到这里。
如果我们把这个模型推广到真实社会里,看看会产生什么结论吧:
你看,其实做上司的风险还是蛮大的。
当下属多起来时,自己不但得不到什么好处,甚至连位置都可能保不住。
这个简单的模型中也反映出这样一个事实:在一个阶级社会中,人口越少越可能出现独裁。
当人口增多而资源紧缺时,如果领导者不能满足大多数人的利益需求,那他的地位也就不稳了。
从另外一个角度看,做一个平民还是不错的,不但有机会拿到那一个小小的金币,还不用担心自己被扔出船外,从而可以安心得坐在电脑前,逛逛果壳网,研究研究数学问题。