囚徒的困境

合集下载

囚徒困境的概念

囚徒困境的概念

囚徒困境一、定义囚徒困境(Prisoner'sDilemma)是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。

或者说在一个群体中,个人做出理性选择却往往导致集体的非理性。

虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况。

“囚徒困境”是1950年美国兰德公司的梅里尔·弗勒德(MerrillFlood)和梅尔文·德雷希尔(MelvinDresher)拟定出相关困境的理论,后来由顾问艾伯特·塔克(AlbertTucker)以囚徒方式阐述,并命名为“囚徒困境”。

两个共谋犯罪的人被关入监狱,不能互相沟通情况。

如果两个人都不揭发对方,则由于证据不确定,每个人都坐牢一年;若一人揭发,而另一人沉默,则揭发者因为立功而立即获释,沉默者因不合作而入狱十年;若互相揭发,则因证据确凿,二者都判刑八年。

由于囚徒无法信任对方,因此倾向于互相揭发,而不是同守沉默。

最终导致纳什均衡仅落在非合作点上的博弈模型。

二、理论起源囚徒困境的故事讲的是,两个嫌疑犯作案后被警察抓住,分别关在不同的屋子里接受审讯。

警察知道两人有罪,但缺乏足够的证据。

警察告诉每个人:如果两人都抵赖,各判刑一年;如果两人都坦白,各判八年;如果两人中一个坦白而另一个抵赖,坦白的放出去,抵赖的判十年。

于是,每个囚徒都面临两种选择:坦白或抵赖。

然而,不管同伙选择什么,每个囚徒的最优选择是坦白:如果同伙抵赖、自己坦白的话放出去,抵赖的话判一年,坦白比不坦白好;如果同伙坦白、自己坦白的话判八年,比起抵赖的判十年,坦白还是比抵赖的好。

结果,两个嫌疑犯都选择坦白,各判刑八年。

如果两人都抵赖,各判一年,显然这个结果好。

囚徒困境所反映出的深刻问题是,人类的个人理性有时能导致集体的非理性-聪明的人类会因自己的聪明而作茧自缚,或者损害集体的利益。

三、主要内容单次多重单次和多次的囚徒困境,结果不会一样。

现实中囚徒困境的实例

现实中囚徒困境的实例

现实中囚徒困境的实例【实用版】目录1.囚徒困境的定义和概念2.囚徒困境在现实中的实例3.解决囚徒困境的方法和策略正文正文囚徒困境是博弈论中的一个经典模型,它描述了两个罪犯被捕后,警方分别与他们单独进行审讯。

如果两人都保持沉默,那么警方无法证明他们有罪,两人都将获得轻判;如果其中一个人供认,而另一个人保持沉默,那么沉默者将被判重刑,而另一个人则不被惩罚;如果两人都供认,则两人都将被判处较轻的刑期。

这个模型反映了在自私的情况下,合作可能导致更好的结果,而不合作则可能导致更差的结果。

尽管囚徒困境是一个抽象的模型,但在现实生活中,我们可以找到许多类似的实例。

例如,在商业竞争中,两家公司可能会陷入囚徒困境。

如果它们都降低价格,那么双方都将失去利润,但如果它们都保持高价,那么可能会有其他竞争者进入市场。

另一个例子是环境问题。

各国都知道减少排放将有利于全球环境,但如果其他国家不采取行动,那么单个国家采取行动将损害其经济。

这些实例都反映了在现实中,囚徒困境是一种常见的现象。

那么,如何解决囚徒困境呢?一种方法是通过合作。

在商业竞争中,如果两家公司可以达成协议,共同维持价格,那么双方都将受益。

在环境问题中,各国可以通过国际协议来共同减少排放。

然而,建立信任是合作面临的一个挑战。

在警方审讯的例子中,罪犯们很难相信对方会保持沉默。

因此,为了解决囚徒困境,我们需要找到方法来建立信任。

另一种方法是通过惩罚和奖励。

如果警方可以向罪犯们提供奖励,以鼓励他们保持沉默,或者制定严厉的惩罚措施,以阻止他们供认,那么囚徒困境就可以得到解决。

同样,在商业竞争中,如果一家公司可以向另一家公司提供奖励,以鼓励它们保持高价,或者制定严厉的惩罚措施,以阻止它们降低价格,那么囚徒困境也可以得到解决。

总的来说,囚徒困境在现实生活中很常见,而解决囚徒困境的方法包括合作和惩罚奖励。

囚徒困境在生活中的启示

囚徒困境在生活中的启示

囚徒困境在生活中的启示囚徒困境是博弈论中的一个经典问题,也是一种常见的社会情境。

它发生在两个囚徒之间,被捕后皆面临可能的刑期。

虽然囚徒有合作的动机,但由于缺乏信任,他们往往面临互相背叛的冲动。

囚徒困境给我们生活带来了许多启示。

首先,囚徒困境教会我们理性思考。

在这个问题中,每个囚徒都需要考虑自己的最佳选择,无法依赖他人的行动。

这使得囚徒必须根据自己的利益,以及对其他囚徒行为的猜测,进行决策。

类似的情况在现实生活中也经常出现,我们需要根据自身利益和情境来做出决策,而不是盲目地依赖他人。

其次,囚徒困境提醒我们合作的重要性。

在囚徒困境中,如果两个囚徒都选择合作,两人的刑期会比互相背叛更短。

这告诉我们合作可以带来更好的结果,而不是仅仅追求个人利益。

在现实生活中,合作不仅能够帮助我们实现共同目标,还可以建立起信任和良好的人际关系。

再次,囚徒困境启示了信任的重要性。

在囚徒困境中,两个囚徒之间缺乏信任,因此很容易被诱导选择背叛。

这告诉我们信任是建立在互相了解和信念上的,而不是盲目的。

在现实生活中,信任可以使人与人之间的交流更加顺畅,也可以为合作提供坚实的基础。

此外,囚徒困境还提醒我们考虑长期利益而非短期利益。

在囚徒困境中,如果两个囚徒都视短期利益为重,选择背叛,最终的结果将是两个人都受损。

然而,如果他们能够着眼于长期利益,选择合作,两人的刑期将会缩短。

在现实生活中,我们也应该考虑到长远的结果来做出决策,而不是仅仅追求眼前的利益。

最后,囚徒困境还展示了适应能力的重要性。

在囚徒困境中,囚徒之间的行为会互相影响,而且在不同的情境下会产生不同的结果。

因此,囚徒需要根据情境的变化来调整自己的策略。

在现实生活中,我们也需要具备灵活性和适应性,根据不同的场景和局势来做出相应的调整。

综上所述,囚徒困境在生活中给我们带来了诸多启示。

它提醒我们理性思考、合作、信任、考虑长期利益以及适应能力的重要性。

通过理解和应用这些启示,我们可以在现实生活中做出更明智的决策,建立更良好的人际关系,实现更好的个人发展。

囚徒困境的启示与意义

囚徒困境的启示与意义

囚徒困境的启示与意义一、引言囚徒困境是博弈论中的一个经典问题,它描述了两个独立的参与者在缺乏沟通和合作的情况下做出决策的情形。

这个问题不仅仅存在于博弈论中,也广泛应用于社会学、政治学、经济学等领域。

本文将探讨囚徒困境的启示与意义。

二、囚徒困境的定义囚徒困境是指两个独立的参与者在缺乏沟通和合作的情况下做出决策,其结果会受到对方行为的影响。

具体来说,每个参与者都有两种选择:合作或背叛。

如果两个人都选择合作,则他们都会获得最好的结果;如果两个人都选择背叛,则他们都会获得最差的结果;如果一个人选择合作而另一个人选择背叛,则前者将获得最差的结果,而后者将获得最好的结果。

三、囚徒困境在社会学中的应用1. 社交心理学在社交心理学中,研究人员使用囚徒困境来探索人们如何做出互动和合作决策。

研究表明,人们更容易选择合作,特别是在长期互动的情况下。

此外,研究还发现,当人们认为对方可能会背叛时,他们更倾向于选择背叛。

2. 社会合作囚徒困境也可以应用于社会合作的研究中。

例如,在环保领域,囚徒困境可以描述一个社区中的人如何决定是否采取环保措施。

如果每个人都采取措施,则整个社区将获得好处;如果只有少数人采取措施,则其他人可以从中受益而不必自己付出代价;但是,如果所有人都不采取措施,则整个社区将遭受损失。

四、囚徒困境在政治学中的应用1. 国际关系在国际关系中,囚徒困境可以描述两个国家之间的互动。

例如,在贸易谈判中,两个国家可能面临着类似于囚徒困境的情况:如果两个国家都签署了协议,则他们都会获得好处;如果两个国家都没有签署协议,则他们都会遭受损失;但是,如果一个国家签署了协议而另一个国家没有签署,则前者将获得好处,而后者将遭受损失。

2. 政治合作囚徒困境也可以应用于政治合作的研究中。

例如,在政府间的合作中,囚徒困境可以描述两个政府之间的互动。

如果两个政府都采取措施,则他们都会获得好处;如果两个政府都不采取措施,则他们都会遭受损失;但是,如果一个政府采取措施而另一个政府没有采取措施,则前者将获得好处,而后者将遭受损失。

囚徒困境案例

囚徒困境案例

囚徒困境案例囚徒困境是博弈论中的一个经典案例,它揭示了在互相合作的情况下,个体之间的利益冲突和合作困境。

这个案例的背后蕴含着深刻的社会学和心理学意义,对于我们理解人类行为和社会关系具有重要的启示作用。

在囚徒困境案例中,两名罪犯被抓获并分开审讯,警察没有足够的证据定罪,只能凭借他们对彼此的供词来判决。

如果两名罪犯都沉默不语,警察只能以轻罪定罪,每人判刑1年;如果其中一人供认,而另一人保持沉默,供认的人将被释放,而另一人将被判10年;如果两人都供认,每人将被判刑8年。

在这种情况下,每个人都面临着一个选择,是合作沉默,还是背叛供认。

从个体的利益出发,无论对方选择什么,供认都是最好的选择。

因为无论对方是沉默还是供认,供认者都能通过合作获得最小的刑期。

但是,如果双方都选择供认,就会导致双方都得到最坏的结果。

这就是囚徒困境的本质,即使合作对每个人来说都是最好的选择,但由于彼此之间缺乏信任,最终导致了双方都选择背叛,从而陷入困境。

囚徒困境案例在现实生活中也有着广泛的应用。

在商业合作中,合作双方往往面临着相互竞争和利益冲突。

在国际关系中,各国之间也存在着类似的困境,例如军备竞赛和贸易争端。

在日常生活中,人们之间的合作也会受到囚徒困境的影响,例如环境保护、资源分配等方面。

如何打破囚徒困境,实现合作共赢呢?学者们提出了一些解决方案。

首先是建立信任,通过长期的合作积累信任,从而减少合作双方的不确定性和风险。

其次是建立有效的合作机制,通过契约、协议等方式规范双方行为,减少信息不对称和道德风险。

再次是采取激励措施,通过奖惩机制激励合作,促使双方选择合作而非背叛。

最后是加强监督,通过第三方监督和公众监督,降低合作双方的违约成本,提高合作的可信度。

囚徒困境案例告诉我们,合作是人类社会生存和发展的基础,但合作中也存在着利益冲突和信任危机。

打破囚徒困境,需要双方共同努力,建立信任、规范合作、激励合作和加强监督,从而实现合作共赢的局面。

管理学定律囚徒困境

管理学定律囚徒困境

管理学定律囚徒困境管理学定律:囚徒困境管理学定律是在组织管理理论和实践中总结出来的普遍规律。

其中,囚徒困境(Prisoner's Dilemma)是一种重要的管理学定律,它描述了合作与背叛之间的困境和抉择。

囚徒困境是在博弈论中提出的一种经典问题,常用来研究团队合作和个体选择。

假设有两名嫌疑犯被警方关押,缺乏证据来定罪。

警方分别与两名嫌疑犯进行独立审讯,以期通过嫌疑犯的供词来定罪。

这个问题的核心在于,如果两名嫌疑犯都保持沉默,警方只能以较轻的罪名定罪,而如果其中一人选择供出另一人,供出者将得到豁免,而被供出者将面临较重的罪名。

如果两人都供出对方,那么都将受到更重的罪名处罚。

在这个困境中,囚徒们面临了两种选择:合作或背叛。

合作是指两名嫌疑犯都保持沉默,以追求较轻的罪名。

背叛则是指一方嫌疑犯选择供出对方,以获得豁免。

然而,如果双方都背叛,就会陷入囚徒困境,造成双输的局面。

囚徒困境的精髓在于,个体利益最大化与整体效益之间的矛盾。

如果每个囚徒只考虑自己的利益,最理性的选择是背叛。

因为无论对方合作还是背叛,背叛者都能获得更好的结果。

但是,当每个囚徒都采取个人最优策略时,整个系统的效益会受到损害,双方都将受到较重的惩罚。

囚徒困境在组织管理中有着广泛的应用。

例如,在企业合作中,团队成员需要克服个人利益与整体利益之间的矛盾。

如果每个成员只追求个人利益,可能会破坏团队合作,导致整个团队效益受损。

而当每个成员都能够退让一些个人利益,保持合作,整个团队将能够共同获得更好的结果。

为了在囚徒困境中获得最佳解决方案,管理者需要采取一系列措施。

首先,管理者应该建立合适的激励机制,激励个体为整体利益而努力。

这可以通过设定个人和团队绩效指标,并与奖励机制相结合来实现。

其次,管理者需要建立有效的沟通渠道,让团队成员明确整体目标,并能够共享信息。

这可以帮助提升团队的合作意识和共识,加强协同合作。

此外,管理者还可以通过培养团队文化和价值观,强调合作、信任和共同目标的重要性。

囚徒困境的破解方法

囚徒困境的破解方法囚徒困境囚徒困境是博弈论的一个重要概念;意思是两个合谋犯罪的人被警察抓住,关在两个单独的牢房里,无法互相交流。

警方给了两名嫌疑人三个选择:一是两人都没有交代罪行,根据掌握的证据,各判两年;二是两人都坦白自己的罪行,根据已经掌握的证据和新坦白的罪行,可能判四年;第三,一个什么都没坦白,另一个罪犯选择背叛搭档,坦白自己的罪行。

认罪立功,当庭释放。

另一个将被判六年。

从共同利益出发,两个嫌疑人都守口如瓶,共同掩盖罪行,才是最好的结果。

他们每个人只在里面呆两年。

但从个人利益来说,你肯定是希望自己认罪,而你的同伙什么都不会告诉你,这样你就无罪释放了。

从个人角度来说,这是一个理性的选择。

但是,每个人都会这么想,都会考虑自身利益的最大化。

最终两人都供认了自己的罪行,但都没有被判无罪,加重了罪行,被判了四年。

人性是自私的;每个人都期望自己的利益最大化,但是这些追求自身利益最大化的理性选择,最终的结果是没有人获利。

对个人来说理性的决定对集体来说是不理性的。

在商业上,类似的案例比比皆是;创业,大家激情澎湃,勇往直前,企业利润蒸蒸日上。

不能长久;在利益面前,一些人开始盘算如何让自己的利益最大化。

于是,相互怯懦、荣辱与共的创业激情不再;取而代之的是团队之间的猜忌和内斗。

企业的经营也停滞不前,甚至分崩离析。

最终,短期内可能会有人的利益最大化。

但是集体利益严重受损。

长期来看,即使是那些短期可能盈利的,长期收益也会缩水甚至消失。

个人所谓的理性选择,导致集体利益的损失;如何解决囚徒困境,促使我们选择合作,在集体层面做出理性决策?密歇根大学数学心理学教授拉波波特发明了一个非常简单的策略:以眼还眼,以牙还牙。

具体来说,有两个步骤:1.一开始,选择合作。

2.在后续的沟通中,你要像他上次对待你那样对待他。

这就是所谓的“以眼还眼,以牙还牙”,用这个策略和对方互动几次之后,对方就会开始主动选择合作了,这就是囚徒困境的破解。

囚徒困境的破解方法

囚徒困境的破解方法囚徒困境是博弈论中的一个经典问题,描述了两个囚犯因是否合作而面临的选择。

如果两人都合作,他们将会受到较轻的刑罚;如果其中一人背叛另一人,背叛者将会受到豁免而合作者将会受到最严重的刑罚;如果两人都背叛,他们将会受到较重的刑罚。

这个问题引发了人们对合作与背叛、信任与欺骗的思考,也有很多学者提出了各种各样的破解方法。

首先,要建立信任。

在囚徒困境中,信任是非常重要的,因为只有建立了信任,双方才能够愿意合作。

在现实生活中,建立信任可以通过多种方式,比如坦诚相待、履行承诺、互相支持等。

只有建立了信任,双方才能够在困境中相互支持,共同面对问题。

其次,要加强沟通。

在囚徒困境中,双方的选择是基于对对方的预期。

如果双方能够充分沟通,了解对方的意图和想法,就能够更好地做出决策。

因此,加强沟通是破解囚徒困境的关键。

在现实生活中,加强沟通可以通过多种方式,比如面对面交流、书面沟通、团队会议等。

只有加强了沟通,双方才能够更好地理解彼此,从而更好地合作。

再次,要建立合作机制。

在囚徒困境中,双方的利益是相互关联的,只有建立了合作机制,才能够更好地协调双方的利益。

在现实生活中,建立合作机制可以通过多种方式,比如签订合作协议、建立利益共享机制、设立奖惩机制等。

只有建立了合作机制,双方才能够更好地协调利益,实现双赢。

最后,要树立长远利益观。

在囚徒困境中,双方往往会因为眼前的利益而忽视长远的利益,从而导致双方都选择背叛。

因此,要树立长远利益观,考虑双方的长远利益,才能够更好地破解囚徒困境。

在现实生活中,树立长远利益观可以通过多种方式,比如设立长期合作目标、考虑长期影响、注重可持续发展等。

只有树立了长远利益观,双方才能够更好地协调眼前利益和长远利益,从而更好地合作。

综上所述,囚徒困境是一个复杂的问题,破解囚徒困境需要双方共同努力。

只有建立信任、加强沟通、建立合作机制、树立长远利益观,双方才能够更好地合作,共同破解困境。

现实中囚徒困境的实例

现实中囚徒困境的实例:游戏和诚信问题大多数人玩游戏的时候,都会遇到一些难以解决的问题,比如何时开始合作、应该不应该背叛队友等等。

这些问题都可以归为“囚徒困境”,是一种经济学、政治学、社会学、心理学和计算机科学等多个领域共同研究的议题。

简单来说,囚徒困境指的是两个不能相互沟通或依赖彼此的双方,面对合作或背叛的选择,最终会选择背叛。

发生这种情况的原因主要是双方担心被对方背叛,因此不得不先背叛对方。

在游戏中,囚徒困境的例子非常常见。

比如,在双人协作游戏中,如果两个人都合作,他们可以赚取更高的分数,得到更好的奖励,但如果一个人选择背叛,他可以得到更多的分数,而另一个人将得到零分。

因为没有沟通,所以两人不得不依靠自己的判断,来判断对方是否会背叛,并相应地做出决策。

很多游戏都给出了这种“囚徒困境”的例子。

例如,在《侠盗猎车手5》中,玩家可以选择扮演三个不同的角色。

在其中一个任务中,玩家需要控制两个角色进行异地犯罪,如果两个角色都采取合作策略则任务完成,奖励也更高;但如果有一个玩家选择了背叛,他会得到更多的奖励,而另一个玩家会失去任务奖励。

所以,在游戏中,玩家在考虑背叛和合作的时候,不仅要权衡到自己的利益,还要考虑到对方可能的决策。

如果对方选择了背叛,那么你的决策也会有所不同。

虽然这种“囚徒困境”在游戏中不可避免,但一些游戏开发者使用一些方法来减少囚徒困境的影响。

例如,在团队游戏中,如果玩家做的非常好,他们可以获得团队奖励,而不仅仅是个人奖励。

此外,有些游戏会提供沟通工具,让玩家可以更好的协同工作。

职场和社交中也存在着“囚徒困境”。

例如,当两个公司在谈判时,如果双方都采取合作策略,则两方均会受益;如果有一个公司选择了背叛,那么可想而知,对方也会立即更改策略以保护自身利益。

由此可见,“囚徒困境”在社会生活中无处不在,因此,我们不仅要关注自己的利益,还要考虑对方的反应和行为。

在团队协作时,我们需要相互建立信任,避免背叛,以达到共同的目标。

囚徒困境的启示与意义

囚徒困境的启示与意义1. 介绍囚徒困境囚徒困境是博弈论中一个经典的例子,描述了两个囚徒合作或背叛的情况下所面临的不同结果。

这个例子揭示了合作与竞争之间的矛盾,以及个体利益与集体利益之间的潜在冲突。

囚徒困境的实质在于强调了合作的重要性,并引出了一系列对社会和个体行为的启示与意义。

2. 结果分析和解释囚徒困境中的结果主要取决于双方的行为选择,包括合作和背叛两种策略。

以下是可能的结果及其解释:2.1. 双方合作•合作/合作:最优解。

双方选择合作可以获得相对较好的结果。

这种情况下,囚犯表现出相互信任和合作的精神。

2.2. 双方背叛•背叛/背叛:最差解。

双方的背叛选择导致最糟糕的结果。

这种情况下,囚犯表现出相互猜忌和自私的行为。

2.3. 一方合作,一方背叛•合作/背叛:合作者受损。

合作者选择信任对方,但被背叛者利用而受到损失。

这种情况下,背叛者表现出自私和利己主义的行为。

•背叛/合作:背叛者受益。

背叛者利用合作者的信任,取得了最好的结果。

这种情况下,合作者会感到被背叛和愤怒,并对未来的合作持怀疑态度。

3. 启示与意义囚徒困境对社会行为和决策制定产生了深远的影响,以下是囚徒困境的一些重要启示与意义:3.1. 非零和博弈囚徒困境展示了非零和博弈的概念,即在博弈中,协作与竞争之间存在复杂的关系。

双方通过合作可以获得最好的结果,但个体的背叛选择可能导致更好的个人结果。

3.2. 合作的重要性囚徒困境强调了合作的重要性。

只有通过合作,双方才能获得相对较好的结果。

囚犯在困境中体验到了相互合作的益处,这对于我们的社会和个人行为都有深远的启示。

3.3. 长期利益与短期利益的冲突囚徒困境揭示了长期利益与短期利益之间的冲突。

个体可能会选择为了自身短期利益而背叛合作,但这种行为可能会导致长期利益的损失。

在决策制定中,我们需要考虑到长期利益,并尽量避免受短期利益驱使。

3.4. 信任与合作的建立囚徒困境提醒我们建立信任和合作的重要性。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

囚徒困境 若囚徒们不互相合作,则无法脱离困境。囚徒困境是博弈论的非零和博弈中具代表性的例子,反映個人最佳選擇並非团体最佳選擇。雖然困境本身只屬模型性質,但現實中的價格競爭、環境保護等方面,也會頻繁出現類似情況。

單次發生的囚徒困境,和多次重複的囚徒困境結果不會一樣。 在重复的囚徒困境中,博弈被反复地进行。因而每个参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为。这时,合作可能会作为均衡的结果出现。欺骗的动机这时可能被受到惩罚的威胁所克服,从而可能导向一个较好的、合作的结果。作为反复接近无限的数量,纳什均衡趋向于帕累托最优。

囚徒困境的主旨為,囚徒們雖然彼此合作,堅不吐實,可為全體帶來最佳利益(無罪開釋),但在資訊不明的情況下,因為出賣同伙可為自己帶來利益(縮短刑期),也因為同伙把自己招出來可為他帶來利益,因此彼此出賣雖違反最佳共同利益,反而是自己最大利益所在。但實際上,執法機構不可能設立如此情境來誘使所有囚徒招供,因為囚徒們必須考慮刑期以外之因素(出賣同伙會受到報復等),而無法完全以執法者所設立之利益(刑期)作考量。

目录 •1 经典的囚徒困境 ◦1.1 解說 •2 固定局數的囚徒困境 •3 一般形式 •4 现实的例子 ◦4.1 政治学例子:军备竞赛 ◦4.2 经济学例子:关税战 ◦4.3 商业例子:广告战 ◦4.4 自行车赛例子 •5 与囚徒困境相关的各事件 ◦5.1 异想 ◦5.2 “認罪減刑”不可行 ◦5.3 公用品悲劇 •6 重复的囚徒困境 ◦6.1 学习心理学和博弈论 •7 相关的博弈 ◦7.1 封闭袋子交易 ◦7.2 是敌是友? •8 参见 •9 注释 •10 参看文献 •11 外部链接 [编辑] 经典的囚徒困境 1950年,由就職於兰德公司的梅里尔·弗勒德(Merrill Flood)和梅爾文·德雷希爾(Melvin Dresher)擬定出相關困境的理論,後來由顧問艾伯特·塔克(Albert Tucker)以囚徒方式阐述,並命名为「囚徒困境」。经典的囚徒困境如下:

警方逮捕甲、乙两名嫌疑犯,但沒有足够证据指控二人有罪。於是警方分开囚禁嫌疑犯,分别和二人见面,并向雙方提供以下相同的选择:

•若一人認罪並作证检控對方(相關術語稱「背叛」對方),而對方保持沉默,此人将即時獲释,沉默者将判監10年。 •若二人都保持沉默(相關術語稱互相「合作」),则二人同樣判监半年。 •若二人都互相检举(互相「背叛」),則二人同樣判監2年。 用表格概述如下:

甲沉默(合作) 甲認罪(背叛) 乙沉默(合作) 二人同服刑半年 甲即時獲釋;乙服刑10年 乙認罪(背叛) 甲服刑10年;乙即時獲釋 二人同服刑2年

[编辑] 解說 如同博弈論的其他例證,囚徒困境假定每個參與者(即「囚徒」)都是利己的,即都尋求最大自身利益,而不關心另一參與者的利益。參與者某一策略所得利益,如果在任何情況下都比其他策略要低的話,此策略稱為「嚴格劣勢」,理性的參與者絕不會選擇。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。

囚徒到底應該選擇哪一項策略,才能將自己個人的刑期縮至最短?兩名囚徒由於隔絕監禁,並不知道對方选择;而即使他们能交谈,還是未必能夠盡信對方不會反口。就個人的理性選擇而言,檢舉背叛對方所得刑期,總比沉默要來得低。試設想困境中兩名理性囚徒會如何作出選擇:

•若對方沉默、我背叛會讓我獲釋,所以會選擇背叛。 •若對方背叛指控我,我也要指控對方才能得到較低的刑期,所以也是會選擇背叛。 二人面對的情況一樣,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是兩種策略之中的支配性策略。因此,这場博弈中唯一可能達到的纳什均衡,就是雙方参与者都背叛對方,結果二人同樣服刑2年。

这場博弈的纳什均衡,顯然不是顧及團體利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,兩人都只會被判刑半年,总体利益更高,結果也比兩人背叛對方、判刑2年的情況較佳。但根據以上假設,二人均為理性的個人,且只追求自己個人利益。均衡狀況會是兩個囚徒都选择背叛,结果二人判监均比合作為高,總體利益較合作為低。这就是“困境”所在。例子華麗地证明了:非零和博弈中,帕累托最优和纳什均衡是互相冲突的。

[编辑] 固定局數的囚徒困境 此条目或章节的语调或风格可能不適合百科全書的寫作方式。(2010年2月27日) 您可以通过改写来協助改善这篇条目。 请前往讨论页获取进一步的信息。

概括而言囚徒困境進行第一次后会出现以下两种情况: 甲在第一次中被乙指控,即會在第二次指乙,最终导致,甲即时获释,乙服刑10年或二人同服刑2年

双方均保持沉默,即会建立互信的關係,最终导致,二人同服刑半年。 但互信的关系并非牢不可破,这一点也可以被利用,即甲,乙在第一次中共同选择沉默而赢得对方的信任,但甲或乙中的一人在获得对方的信任后指控对方而获得自身最大的里即自身即时获释,但对方将服刑10年。这是一个以牺牲对方利益而获得自身最大利益的一种策略。

如果假设,兩個囚徒均欲利用此策略,并将局数推演为十次,那么就会出现如下的情况:在第一局到第九局的过程中双方均会保持沉默,以期望建立互信關係,并在第十局指控对方,这将最终导致,二人同服刑2年。

再一次假设,双方都明确对方会使用与自己同样的策略,即知道對方會在第十局中指控自己,这样,在第九局时两者间的信任关系的建立即是没有意义的,如此類推,第八局到第一局中信任关系的建立也是没有意义的,即是十局都會互相背叛,也就是纳什均衡。也可推论,在如此的情况下,只有在囚徒困境的局數在不肯定的情況下(即双方均不知道进行的局数),才會出現互相保持沉默以获得信任关系的現象。

[编辑] 一般形式 整理囚徒困境的基本博弈结构,可更清楚地分析囚徒困境。实验经济学常用這種博弈的一般形式分析各种论题。以下是實現一般形式的其中一例:

有两个参与者和一个庄家。参与者每人有一式两张卡片,各印有“合作”和“背叛”。参与者各把一张卡片文字面朝下,放在庄家面前。文字面朝下排除了參與者知道對方選擇的可能性1。然后,庄家翻开兩個参与者卡片,根據以下規則支付利益:

•一人背叛、一人合作:背叛者得5分(背叛诱惑),合作者0分(受骗支付)。 •二人都合作:各得3分(合作报酬)。 •二人都背叛:各得1分(背叛惩罚)。 用支付矩阵表格展示支付如下(以红和蓝分别表示二参与者):

一般形式囚徒困境的支付矩阵 合作 背叛 合作 3, 3 0, 5 背叛 5, 0 1, 1 以“T、R、P、S”符号表示 合作 背叛 合作 R, R S, T 背叛 T, S P, P 以“胜-负”术语表示 合作 背叛 合作 胜, 胜 大负, 大胜 背叛 大胜, 大负 负, 负

简单博弈获得的点数可以得出一些一般化的结论。 T、R、P、S符号表 符号 分数 英文 中文(非术语) 解释 T 5 Temptation 背叛诱惑 单独背叛成功所得。 R 3 Reward 合作报酬 共同合作所得 P 1 Punishment 背叛惩罚 共同背叛所得 S 0 Suckers 受骗支付 被单独背叛所获

若以T(Temptation)=背叛诱惑,R(Reward)=合作报酬,P(Punishment)=背叛惩罚,S(Suckers)=受骗支付,以个人选择得分而言,可得出以下不等式。

T>R>P>S (解:从5>3>1>0获得以上不等式) 若以整体获分而言,将得出以下不等式。 2R>T+S或2R>2P (解:2×3>5+0或2×3>2x1;合作2人共得6分,比起互相背叛的共得2分及单独背叛的共得5分,显然合作获分比背叛高。合作在团体而言是支配性策略。)

而重复博弈或重复的囚徒困境将会使参与者从注重T>R>P>S转变成注重2R>T+S。就是说将使参与者脱离困境。 以上理论是道格拉斯·霍夫施塔特创建的。

[编辑] 现实的例子 上述例子可能顯得不甚自然,但现实中,无论是人类社会或大自然都可以找到类似囚徒困境的例子,將結果劃成同樣的支付矩阵。社会科学中的经济学、政治学和社会学,以及自然科学的动物行动学、进化生物学等学科,都可以用囚徒困境分析,模擬生物面對无止境的囚徒困境博弈。囚徒困境可以廣為使用,說明這種博弈的重要性。以下为各界例子:

[编辑] 政治学例子:军备竞赛 在政治学中,兩国之间的军备竞赛可以用囚徒困境來描述。两国都可以聲稱有两种选择:增加军备(背叛)、或是达成削减武器协议(合作)。兩國都无法肯定对方会遵守协议,因此两国最终会倾向增加军备。似乎自相矛盾的是,雖然增加軍備會是兩國的「理性」行為,但结果卻顯得「非理性」(例如會对经济造成都有损坏等)。这可視作遏制理论的推论,就是以强大的军事力量来遏制对方的进攻,以达到和平。 [编辑] 经济学例子:关税战 两个国家,在关税上可以有以两个选择:

1.提高关税,以保护自己的商品。(背叛) 2.与对方达成关税协定,降低关税以利各自商品流通。(合作) 当一国因某些因素不遵守关税协定,而独自提高关税(背叛)时,另一国也会作出同样反应(亦背叛),这就引发了关税战,两国的商品失去了对方的市场,对本身经济也造成损害(共同背叛的结果)。然后二国又重新达成关税协定。(重复博弈的结果是将发现共同合作利益最大。)

[编辑] 商业例子:广告战 商业活动中亦会出现各种囚徒困境例子。以广告竞争为例。

两个公司互相竞争,二公司的广告互相影响,即一公司的广告较被顾客接受则会夺取对方的部分收入。但若二者同时期发出质量类似的广告,收入增加很少但成本增加。但若不提高广告质量,生意又会被对方夺走。

此二公司可以有二选择: 1.互相达成协议,减少广告的开支。(合作) 2.增加广告开支,设法提升广告的质量,压倒对方。(背叛) 若二公司不信任对方,无法合作,背叛成为支配性策略时,二公司将陷入广告战,而广告成本的增加损害了二公司的收益,这就是陷入囚徒困境。在现实中,要二互相竞争的公司达成合作协议是较为困难的,多数都会陷入囚徒困境中。

[编辑] 自行车赛例子 自行车赛事的比赛策略也是一种博弈,而其结果可用囚徒困境的研究成果解释。例如每年都举办的環法自行車賽中有以下情况:选手们在到终点前的路程常以大队伍(英文:Peloton)方式前进,他们采取这策略是为了令自己不至于太落后,又出力适中。而最前方的选手在迎风时是最费力的,所以选择在前方是最差的策略。通常会发生这样的情况,大家起先都不愿意向前(共同背叛),这使得全体速度很慢,而后通常会有二或多位选手骑到前面,然后一段时间内互相交换最前方位置,以分担风的阻力(共同合作),使得全体的速度有所提升,而这时如果前方的其中一人试图一直保持前方位置(背叛),其他选手以及大队伍就会趕上(共同背叛)。而通常的情况是,在最前面次数最多的选手(合作)通常会到最后被落后的选手赶上(背叛),因为后面的选手骑在前面选手的冲流之中,比较不费力。

相关文档
最新文档