走出囚徒困境

合集下载

第三讲 囚徒困境和破解之道

第三讲 囚徒困境和破解之道

分和所利(得)的部分哪个更多。(盗窃与抢劫)
特别提示:
如果有一种制度,在该制度下,每个人都只
能通过利人才能实现利己的目标,这一定是
一种好的制度。(市场的逻辑)
第六章 真实世界的囚犯困境
第一节 大萧条与凯恩斯革命
一、大萧条
工业产值下降 物价下跌 平均失业率 (1929-1932) (1929-1932)(1930-1938)
美国
英国
50%
10%
30%
25%
18%
15%
德国
法国
40%
30%
30%
40%
20%
10%
第一节 大萧条与凯恩斯革命
二、凯恩斯对大萧条的解释
1、消费需求不足 2、投资需求不足
3、ቤተ መጻሕፍቲ ባይዱ格刚性
第二节 价格战
第三节 独裁与多数人的懦弱
在美国波士顿犹太人屠杀纪念碑上,刻着德国新教牧师 马丁·尼莫拉的一段忏悔:“他们先是来抓共产党人,
一、我所记忆的建国后开展的历次运动: (1)土地改革运动 (2)镇压反革命运动 (3)抗美援朝运动 (4)建国后第一次整风运动 (5)连队民主运动 (6)三查运动 (7)忠诚老实政治自觉运动 (8)清理“中层”运动 (9)民主改革运动 (10)电影《武训传》和宣传武训的批判运动 (11)三自革新学习与教会民主改革运动 (12)农业生产互助合作运动 (13)文化教育战线和各种知识分子自我教育和自我改造运动 (14)反贪污、反浪费、反官僚主义的三反运动 (15)文学艺术界整风学习运动 (16)爱国增产节约运动 ----摘录于胡甫臣《对建国后历次政治运动的认识》
对称条件下的囚犯困境
在一个2人双策略对称博弈中,如果满足以下条件:

走出囚徒困境的方法

走出囚徒困境的方法

走出囚徒困境的方法走出囚徒困境是囚徒困境理论中的一种博弈策略,目的是通过合作而达到双赢的结果。

在囚徒困境中,两名囚犯面临着合作与背叛的选择,而他们的选择会影响到自己和对方的利益。

在博弈中,囚徒之间往往会因为互相不信任而无法合作,导致最终双方都会选择背叛,得不到最优利益。

然而,通过一些方法和策略,我们可以尝试走出囚徒困境,实现合作的局面。

以下是一些可能的方法:1. 互信建立:在囚徒困境中,缺乏互信是导致背叛行为的主要原因之一。

因此,建立互信是走出困境的关键。

可以通过多次合作而逐渐建立互信,或者通过个人交流和沟通来减少误解和不信任。

2. 共同利益的确立:为了走出囚徒困境,双方需要认识到彼此的共同利益。

只有意识到合作对双方都有好处,才会更有动力选择合作。

因此,需要明确表达共同的目标和利益,以激发囚犯们的合作动机。

3. 合作约束的设立:为了增加合作的可能性,可以引入一些合作约束。

例如,设立一个规则或约定,双方必须遵守合作原则,在确定的条件下共同决策。

这样可以提供一种制约机制,减少背叛的可能性。

4. 长期思维:在囚徒困境中,双方往往会陷入短期利益最大化的思维,导致最终陷入困境。

通过引入长期思维,囚犯们可以意识到合作的长远好处,从而更有动力选择合作。

可以通过宣传教育,让囚犯们意识到合作的长远利益,从而改变他们的行为。

5. 多次博弈的机会:为了增加合作的机会,可以提供多次博弈的机会。

通过多次博弈,囚犯们可以逐渐建立信任,积累经验,并且有机会改变策略。

多次博弈可以为双方提供尝试合作的机会,从而逐渐改变困境。

6. 外部监督与奖惩机制:引入外部监督与奖惩机制可以促使囚犯选择合作。

通过设立奖励机制,对合作行为给予积极激励;同时,对背叛行为进行惩罚,以增强合作的动力。

外部监督与奖惩机制可以起到约束和引导作用,帮助囚犯们走出困境。

总的来说,走出囚徒困境需要通过建立互信、确立共同利益、设立合作约束、引入长期思维、提供多次博弈机会以及引入外部监督与奖惩机制等方法。

囚徒困境的破解方法

囚徒困境的破解方法

囚徒困境的破解方法囚徒困境囚徒困境是博弈论的一个重要概念;意思是两个合谋犯罪的人被警察抓住,关在两个单独的牢房里,无法互相交流。

警方给了两名嫌疑人三个选择:一是两人都没有交代罪行,根据掌握的证据,各判两年;二是两人都坦白自己的罪行,根据已经掌握的证据和新坦白的罪行,可能判四年;第三,一个什么都没坦白,另一个罪犯选择背叛搭档,坦白自己的罪行。

认罪立功,当庭释放。

另一个将被判六年。

从共同利益出发,两个嫌疑人都守口如瓶,共同掩盖罪行,才是最好的结果。

他们每个人只在里面呆两年。

但从个人利益来说,你肯定是希望自己认罪,而你的同伙什么都不会告诉你,这样你就无罪释放了。

从个人角度来说,这是一个理性的选择。

但是,每个人都会这么想,都会考虑自身利益的最大化。

最终两人都供认了自己的罪行,但都没有被判无罪,加重了罪行,被判了四年。

人性是自私的;每个人都期望自己的利益最大化,但是这些追求自身利益最大化的理性选择,最终的结果是没有人获利。

对个人来说理性的决定对集体来说是不理性的。

在商业上,类似的案例比比皆是;创业,大家激情澎湃,勇往直前,企业利润蒸蒸日上。

不能长久;在利益面前,一些人开始盘算如何让自己的利益最大化。

于是,相互怯懦、荣辱与共的创业激情不再;取而代之的是团队之间的猜忌和内斗。

企业的经营也停滞不前,甚至分崩离析。

最终,短期内可能会有人的利益最大化。

但是集体利益严重受损。

长期来看,即使是那些短期可能盈利的,长期收益也会缩水甚至消失。

个人所谓的理性选择,导致集体利益的损失;如何解决囚徒困境,促使我们选择合作,在集体层面做出理性决策?密歇根大学数学心理学教授拉波波特发明了一个非常简单的策略:以眼还眼,以牙还牙。

具体来说,有两个步骤:1.一开始,选择合作。

2.在后续的沟通中,你要像他上次对待你那样对待他。

这就是所谓的“以眼还眼,以牙还牙”,用这个策略和对方互动几次之后,对方就会开始主动选择合作了,这就是囚徒困境的破解。

囚徒困境终于被破解了!小伙1句狠话轻松破解难题,豪取28万奖金

囚徒困境终于被破解了!小伙1句狠话轻松破解难题,豪取28万奖金

囚徒困境终于被破解了!小伙1句狠话轻松破解难题,豪取28万奖金囚徒困境,据说是博弈论中最棘手的难题,无人可破!不过,这个世纪难题却被一个英国小伙用1句话给轻松破解了,并且豪取28万人民币的奖金。

01、什么是囚徒困境?囚徒困境,是1950年美国兰德公司提出来的,并以故事的形式进行阐述:两人因合伙盗窃杀人被逮捕,警方将他们两人分开进行审讯,并给了他们3个选择:•1、如果两个人都抵赖,各判刑1年;•2、如果两个人都坦白,各判刑8年;•3、如果其中一人坦白,坦白者会被释放,抵赖者则会判刑10年。

很明显,两个囚徒都面临着两种选择:坦白或者抵赖。

由于两人处于隔离状态,并不知道同伙会如何选择,那么,他们就只能基于人性的自私,而去断定同伙肯定会去对其来说最有利的方式:坦白!既然同伙坦白了,那么自己抵赖就会被判10年,太亏了。

于是,他自己也会选择坦白——最坏也是8年,如果运气好,还可能直接释放。

这样一来,每个人都这样猜想对方,那么他们最终的结果就是都坦白,同时被判刑8年。

02、英国小伙破解囚徒困境的神操作!囚徒困境充分利用了人性的自私,基本无法破解。

不过,《墨菲定律》一书中有一个经典案例,讲述了如何破解这个棘手的难题。

英国BBC公司曾经有个老牌奖游戏节目叫作《金球》,节目开始有四名选手参加,然后淘汰到只剩下两名选手来角逐一笔巨额奖金。

角逐环节是这样的:主持人给每个人两个球,其中一个写着“平分”,另一个写着“偷走”,两名选手需要从中选择一个球。

根据两个人的选择,会出现三种情况:•1、两个人都选择了“平分”,那就两个人平分全部大奖。

•2、如果一个人选择“平分”而另一个人选择“偷走”,那么选择“偷走”的人拿走全部奖金,选择“平分”的人出局。

•3、如果两个人都选择了“偷走”,那么两个人同时出局,一分钱都拿不到。

在做出各自的选择前,两个人可以互相商量,但是最后选择的时候必须单独选择。

这是一个典型的囚徒博弈游戏,相当于两个人在被捕前串供,但审讯时仍然隔离囚禁。

囚徒困境与走出囚徒困境

囚徒困境与走出囚徒困境

囚徒困境与走出囚徒困境引言:在一堂课中,一个小组讲到了囚徒困境这问题,老师当堂随机提问了两位同学,一位同学的回答是选择背叛检举对方,另一位同学的回答是不检举对方。

而我所说的“另一位同学”也就是我,当这个问题出现的时候,我的脑海里先浮现的是不检举对方,对于这个问题,我就在考虑如果我背叛了对方,那么我么两个人的刑期之和将会大大增加,如果我不检举对方,对方也不检举我,那么我们两个人将会之服刑期一年,这样我们两个人也就是一个集体所能够达到的利益才是最大的。

但是在博弈论中,按照纳什均衡的理论,我的这个选择说明我不是一个理性的个体,所以我将会在此讨论一下囚徒困境的问题一、囚徒困境囚徒困境是这样一个问题,问题的背景是警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。

于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:若一人认罪并作证检控对方(也就是背叛对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。

若二人都保持沉默(也就是双方合作),则二人同样判监1年。

若二人都互相检举(背叛),则二人同样判监8年。

表格1囚徒困境结果乙合作乙背叛甲合作甲1年,乙1年甲10年,乙0年甲背叛甲0年,乙10年甲8年,乙8年这个困境成立的条件:1.甲乙两人分开囚禁,不能互通信息2.两个人都知道规则与结果3.每个人都是一个理性的个体。

所以大部分人在看到这个问题的时候都会有这样的分析:如果对方选择合作,我选择合作,那么我们都会一年刑期,我选择背叛呢,那么我将会被释放。

如果对方选择背叛,我也只有选择背叛才会让自己的兴起最短。

根据纳什均衡,每个囚徒都是理性的个体(即追求自身利益的最大化,并不关心其他人自身的利益),只会选择利益最大的一个选项(即背叛),这样的一个结果出现的一个基本条件就是两个囚徒并不能够相互串通,所以他们只能相互揣摩对方的心里来选择一个最佳的答案。

正是因为两个人面对的情况一样,两个理性的个人作出的选择也都一样,所以囚徒的困境才会出现(即两个人选择的结果都为背叛),也就达到了纳什均衡。

如何突破囚徒困境?

如何突破囚徒困境?

如何突破囚徒困境?1950年,美国普林斯顿大学数学家阿尔伯特•塔克(Albert tucker)编了一个故事向斯坦福大学的一群心理学家们解释什么是博弈论,这个故事后来成为博弈论中最著名的案例。

故事内容是:两个嫌疑犯(A和B)作案后被警察抓住,隔离审讯;警方的政策是“坦白从宽,抗拒从严”,如果两人都坦白则各判8 年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白则因证据不足各判1年。

那么,囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于被分开监禁,并不知道对方的选择;而且即使他们能订立攻守同盟,也未必能尽信对方不会反咬。

在现实中,这样的例子很多,两个人作案前发誓相约一旦被抓,要守口如瓶,不出卖对方,但在警方三审两审之后,就都扛不住招供了。

因为就个人的理性选择而言,出卖背叛对方所得刑期,总比沉默要来得低。

试设想困境中两名理性囚徒会如何作出选择:• 若对方沉默、我选择背叛会让我获释,所以我该选择背叛。

• 若对方背叛指控我,我也要指控对方才能得到较低的刑期——八年,所以也应选择背叛。

• 所以无论对方是沉默还是背叛,至少我能得到次好的结果——被判八年,但如果我沉默而对方选择坦白,则我将面临最坏的结果被判十年。

二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。

背叛是两种策略之中的支配性策略,不依赖于对方的合作,不依赖于对方的守约行为。

因此,这场博弈中唯一可能达到的均衡,就是双方参与者都背叛对方,结果二人同样服刑8年。

在囚徒困境中,如果两个囚徒都拒绝坦白,则二人都能获得最少刑期一年,所以都不坦白,是能让两个囚徒获得共赢结果的唯一方案,也说明个人最佳选择并非团体最佳选择。

但如何才能得到最优的共赢结果呢?黑手党的招数曾非常有效地破解了警方设置的囚徒困境,首先,黑手党组织将忠实视为成员必须具备的最重要的品质,组织内的提升必会考虑其对组织的忠诚度,同时,一旦有组织成员出卖自己人,黑手党组织将不惜代价,天涯海角地追杀背叛者。

摆脱“囚徒困境”对策研究

摆脱“囚徒困境”对策研究

摆脱“囚徒困境”对策研究【摘要】“囚徒困境”是博弈论中的一个经典案例,对这个问题的研究涉及经济学、政治学、社会学、哲学、伦理学等广泛的领域。

本文通过分析“囚徒困境”及其假设条件,找出“囚徒困境”的缺陷,进而结合案例提出摆脱“囚徒困境”的方法。

【关键词】“囚徒困境”;理性人;信息不对称;重复博弈一、“囚徒困境”的含义及其提出博弈论是西方经济学中的重要理论,而“囚徒困境”是博弈论中的一个经典案例,人们经常运用“囚徒困境”来分析一些实际问题。

在现实世界中,“囚徒困境”也是随处可见,正所谓”你我皆囚徒,何处无困境”。

(一)定义“囚徒困境”(prisoner’s dilemma)是指两个被捕的囚徒之间的一种特殊博弈,说明为什么甚至在合作对双方都有利时,保持合作也是困难的①。

(二)提出及其模型分析1950年,由就职于兰德公司的梅里·弗勒德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问艾伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。

“囚徒困境”是博弈论的经典案例,常被用来解释生活中的一些现象,如公共物品提供不足,垄断行业价格同盟的破坏等[2],它的具体内容如下:两个嫌疑犯A、B 合伙作案后被警察抓住,由于缺乏足够的证据指证他们所犯的罪行,分别把他们关在不同的屋子里审讯以防止他们串供。

警察分别告诉他们:如果两个人都认罪坦白,各判八年;如果两个人都抵赖不坦白,各判一年(或许因证据不足);如果其中一人坦白另一人抵赖,坦白的被释放,不坦白的判刑十年(“坦白从宽,抗拒从严”)。

在两个囚犯都是理性人的前提假设下,囚犯A会进行权衡抉择:如果B坦白了,A选择坦白被判8年,不坦白被判10年,坦白是优势策略;如果B不坦白,A坦白被释放,不坦白被判1年,同样对于A来说坦白是优势策略,这样A 就选择了坦白。

第一章 囚徒困境与纳什均衡

第一章  囚徒困境与纳什均衡

政客的囚徒困境
1984年 1984年,美国联邦预算赤字实在太高 了。裁减必要的巨额开支在政治上并不 可行,因此,大幅增税应是不可避免的。 可行,因此,大幅增税应是不可避免的。 民主党总统候选人沃尔特·蒙代尔在竞 民主党总统候选人沃尔特 蒙代尔在竞 选中提出增税政策,却被罗纳德 里根打 罗纳德·里根 选中提出增税政策,却被罗纳德 里根打 得落花流水,因为里根许诺绝不加税。 得落花流水,因为里根许诺绝不加税。 这就是为什么美国是世界上最富有的 国家,却同时又是最大的债务国的原因。 国家,却同时又是最大的债务国的原因。
不巴结
(落选,升官) 落选,升官)
(升官或落选, 升官或落选, 升官或落选 升官或落选) 升官或落选) 三乌丛臣
巴结
不巴结
双方均巴结,则双方成本高;双方均不巴结,则双方成本 双方均巴结,则双方成本高;双方均不巴结, 低。然而“背叛”是双方的最佳的策略。 然而“背叛”是双方的最佳的策略。
囚徒与战士
约瑟夫·海勒《 22条军规》 约瑟夫·海勒《第22条军规》 条军规 的一个故事: 的一个故事: 第二次世界大战胜利在望, 第二次世界大战胜利在望,投 弹手尤塞里安不想成为胜利前夕最 后一批牺牲者, 后一批牺牲者,千方百计逃避执行 任务。他的上级军官问: 可是, 任务。他的上级军官问:“可是, 假如我方士兵都这么想呢? 假如我方士兵都这么想呢?”可尤 塞里安答道: 那我若是不这么想, 塞里安答道:“那我若是不这么想, 岂不就成了一个大傻瓜? 岂不就成了一个大傻瓜?”
经典案例——囚徒困境 囚徒困境 经典案例
就是说,对方背叛,你也背叛将会更好些。这意味着, 就是说,对方背叛,你也背叛将会更好些。这意味着, 无论对方如何行动,如果你认为对方将合作, 无论对方如何行动,如果你认为对方将合作,你背叛能 得到更多;如果你认为对方将背叛, 得到更多;如果你认为对方将背叛,你背叛也能得到更 你背叛总是好的。 多。你背叛总是好的。 于是两人都作出招供的选择,这对他们个人来说都是最 于是两人都作出招供的选择, 佳的,即最符合个体理性的选择。 佳的,即最符合个体理性的选择。 照博弈论的说法,这是本问题的惟一平衡点。 照博弈论的说法,这是本问题的惟一平衡点。只有在这 一点上,任何一人单方面改变选择, 一点上,任何一人单方面改变选择,他只会得到较差的 结果。这一点就是纳什均衡 纳什均衡( Equilibrium)。 结果。这一点就是纳什均衡(Nash Equilibrium)。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

囚徒困境博弈
囚徒困境
这些社会困境大多可用著名的囚徒困境囚徒 B 坦白
-8,-8
抵赖 0,-10
抵赖 -10,0 -1,-1
社会困境的基本类型
负向的相互作用,一个参与人的行动给其他参与人 带来了损失,但他却没有进行补偿。如价格竞争、 虚假伪劣商品、军备竞赛;
公地悲剧(哈丁,1968) ,无法分解的公共资源 被过度使用。如渔业资源枯竭、交通拥堵、环境污 染;
走出囚徒困境
广泛存在的社会困境
在市场交易、企业管理、社会交往、政治运动 与战争中,人们经常会陷入到某种社会困境中:
酷烈的价格战和军备竞赛,全球渔业资源枯竭和 公地悲剧,交通拥,高考以及研究生考试越来越 激烈的竞争,假货泛滥以及旅游市场的混乱,养 老、医疗、教育等公共服务严重不足。
那么,我们如何才能走出这些困境?
可以证明,在贴现因素δ 较大时,双方采用冷酷策略构 成一个子博弈精炼纳什均衡。
冷酷策略是均衡解的证明
假设博弈方1已经采用了冷酷策略。
如果博弈方2 也选择冷酷策略,那么他们每次都是合作
结果,则总得益的现值是:
1 4 *4 2
*
4

......

1
4

• 如果博弈方2不采取冷酷策略,在第一阶段采用L,因为 第二阶段起被报复只能采用L, 因而得益为(5,1,1,...)。总 得益的现值是:
例如商业活动中的回头客:商店和顾客的每次交易都 是一次独立博弈,但双方在每次交易时,会考虑对以 后交易的影响。
我们把这种重复博弈理解成一个序贯博弈,更能反映 问题的实质。
重复的囚徒困境博弈
坦白 囚徒 1
不坦白
囚徒 2
坦白
不坦白
-5,-5
0,-8
-8,0
-1,-1
在每一个阶段,参与人的选择都不会是独立的,他们会考虑, 如果这一阶段自己选择坦白,那么以后阶段对方也会选择坦白 来报复自己。而如果自己这一阶段选择不坦白,对方在以后阶 段也可能会选择不坦白来响应自己合作的愿望。
这就使重复的囚徒困境博弈不同于单一阶段的博弈
重复博弈的收益
某参与人在重复博弈的总得益是他各次博弈得益的总和。
考虑时间价值:引入贴现系数δ将每一阶段的得益折现成 第一阶段的得益。如果一个t次重复博弈的某博弈方,各阶 段得益分别为л1,л2,…,лt,则他的总得益为:
t
л=л1+δл2+δ2л3…+δt-1лt=t1 t t 1
免费搭车,人们不会自觉参与公共品的生产,导致 公共品供给不足。如公共医疗、公共教育、公共文 化、慈善、养老院和儿童福利院都严重短缺。
囚徒困境的意义
如果从两个囚徒的共同利益来思考,那么他们都愿意 选择“抵赖”,但从个人利益最大化出发,他们都会 选择各自的占优策略:坦白。
这反映了人类社会面临的一个深刻的难题:个人理性 的自相矛盾以及与集体理性的冲突
因此,不论前一阶段结果如何,第二阶段的唯一结果就是 囚徒困境博弈唯一的纳什均衡(坦白,坦白)。
回到第一阶段,理性的博弈方应当对第二阶段的结局非常 清楚,知道第二个阶段的结果必然是(坦白,坦白)
有限次重复囚徒困境博弈
因此,参与人在第一阶段的行动选择不会影响它们在第 二阶段的行动选择。该重复博弈的每个阶段博弈与一次 性囚徒困境博弈是完全等价的,该博弈的唯一的子博弈 精炼纳什均衡就是在每一个阶段都选择(坦白,坦白)。
因此,参与人在决定是否背叛时,有三个重要的影响因素: 背叛的收益与成本、合作 的收益,以及衡量未来与现在相 对重要性的贴现系数δ
重复两次的囚徒困境博弈
两个囚徒会选择不坦白的合作策略吗?
根据序贯博弈的方法,用逆推法分析: 首先考虑双方在第二阶段的选择。由于第二阶段的行动对 第一阶段的结果没有影响,此后也不再有任何的后续阶段, 因此选择坦白以获得当前的利益最大化是囚徒在第二阶段 中决策的唯一原则。
因此,走出囚徒困境的焦点是,如何克服囚徒追逐短 期私利的背叛动机,让他们达到并维持互利的合作结 果。
走出囚徒困境的方法
在考虑什么样的方法能够走出囚徒困境时,参与人背 叛的成本和合作的收益之间的相对大小是至关重要的 决定因素。
而这一得一失的相对重要性受到参与人对现在和未来 利益的相对重视程度的影响
2

5
*1
2
*1 ......

5 1
冷酷策略是均衡解的证明

1 2
解得: 1/ 4

4 5 1 1
•这样,当贴现率大于0.25时,此时博弈方2就会 愿意采用冷酷策略。于是,当博弈方1采用冷酷 策略的情况下,冷酷策略也是博弈方2的最佳策 略。
无限次重复囚徒博弈的求解 因为没有最后阶段的博弈,所以无法使用逆推方法求解, 只能使用策略构造的方法得出均衡解。
无限次重复囚徒困境博弈的求解
博弈方 1
H L
博弈方2
H
L
4,4 0,5
5,0 1,1
假设双方采用如下冷酷策略: • 第一阶段采用合作行动H,在第t阶段,如果前t-1阶
段的结果都是(H,H)则继续采用H,否则以后永远选 择背叛行动L进行报复。
如果是10次、100次或者是无限多次的重复囚徒困境博 弈,囚徒会选择合作策略吗?
依照上述分析方法,我们可以证明3次、4次或者n次重复 囚徒困境的博弈结果都是一样的,就是每次博弈他们都会选 择(坦白,坦白)。 因此,在有限次重复的囚徒困境博弈中,参与人仍然无法 走出背叛的困境
无限次重复博弈与无名氏定理
走出囚徒困境的主要方法有:
重复博弈 对背叛的惩罚和对合作的奖励 推举领导 声誉机制
重复博弈
社会交往一般来说并不是一次性的,而往往是多次重 复持久的长期交往关系。于是,参与人在每一次行动 选择时,就不仅考虑这次博弈的得益,而且要考虑多 次博弈的总体得益。
因此,如果未来合作的收益足够大,参与人就不会为 获得当前一次的背叛收益去选择背叛。
从对有限次重复囚徒困境博弈分析可知,存在最后一次博弈 是使参与人之间无法实现合作的关键。
因此,如果是无限次重复囚徒困境博弈,没有了最后一次博 弈,参与人知道博弈会一直持续下去,就可能愿意选择合作 的策略
这就是著名的无名氏定理的结论(folk theorem) ,这为走 出囚徒困境奠定了理论基础。
相关文档
最新文档