摆脱“囚徒困境”对策研究

合集下载

囚徒困境的破解方法

囚徒困境的破解方法囚徒困境是一种博弈论中经常出现的情形，它描述了两个合作囚犯在被分开审讯的情况下面临的选择。

在这种情况下，每个囚犯都面临着合作和背叛的选择，而他们的最终结果又取决于对方的选择。

在现实生活中，囚徒困境不仅仅存在于刑事案件中，也存在于商业竞争、国际关系等各个方面。

如何破解囚徒困境，实现合作共赢，是一个重要的课题。

下面我们将从几个方面来探讨囚徒困境的破解方法。

首先，建立信任是破解囚徒困境的关键。

在囚徒困境中，囚犯之间缺乏信任，这导致他们往往会选择背叛对方，以谋求个人利益的最大化。

而在现实生活中，建立信任同样是破解囚徒困境的关键。

只有建立起相互信任的基础，才能够实现合作共赢的局面。

因此，各方在面临困境时，应该努力去建立彼此之间的信任，而不是陷入相互猜疑的怪圈之中。

其次，加强沟通是破解囚徒困境的重要手段。

囚徒困境的产生往往与信息不对称有关，当双方缺乏有效的沟通渠道时，很容易导致误解和冲突的产生。

因此，在面对困境时，各方应该加强沟通，及时交流信息，消除误解，寻求共识。

只有通过充分的沟通，才能够找到最适合双方利益的解决方案，从而打破囚徒困境的局面。

再次，建立有效的激励机制也是破解囚徒困境的关键。

在囚徒困境中，囚犯之间缺乏有效的激励机制，这导致他们往往会选择短期个人利益的最大化，而忽视长期合作带来的利益。

在现实生活中，同样需要建立起有效的激励机制，激励各方共同合作，共同谋求长远利益。

只有通过建立有效的激励机制，才能够真正地破解囚徒困境，实现合作共赢的局面。

最后，建立良好的制度约束也是破解囚徒困境的重要手段。

在囚徒困境中，缺乏有效的制度约束，导致囚犯往往会选择背叛对方，以谋求个人利益的最大化。

在现实生活中，同样需要建立良好的制度约束，约束各方的行为，防止其陷入囚徒困境的怪圈之中。

只有通过建立良好的制度约束，才能够有效地防止囚徒困境的产生，实现合作共赢的局面。

综上所述，囚徒困境的破解方法包括建立信任、加强沟通、建立有效的激励机制和建立良好的制度约束。

通证破解囚徒困境难题

● 话说囚徒困境难题及对策
International Financing
May 2019 国际融资
Token Solves the Prisoner’s Dilemma
通证破解囚徒困境难题■源自陈源戴剑人与动物区分的非常重要的一点协作就是大规模协作。协作也是现今商业社会极度缺乏的资源。本文通过分析合作困境，找寻解决方案，并通过现实的案例进行了解析
释，沉默者因抗拒从严而被重判入狱20年；若互相揭发，则因证据确实，二人各判10年监禁。
两个合作者进行博弈后，两者均获得“奖励”; 两个背叛者进行博弈后，两者均获得“惩罚”; 当合作者与背叛者进行博弈后，背叛者获得“诱惑”，而合作者则获得“被骗”。相比之下，两个囚徒都拒供是对他们最好的结果，都供认是最糟糕的结果。但是，这个对两个囚徒都好的结果实际上很难发生。因为每个囚徒都会发现：
囚徒困境通常被看作是个人理性和集体理性冲突的经典情形。因为在囚徒困境的局势之下，每个人根据自己的利益做出的决策，但最后的结果却是集体遭殃。现实中的诸多问题和现象都是囚徒困境的翻版。比如：厂商之间的价格战，价格同盟，军备竞赛，公地的悲剧，团队中的偷懒卸责行为，学校教育中的应试教育的问题等。
合作演化的解
自20世纪60年代以来，人们为了研究广泛存在的协作行为，学界做了如下的探索。比如亲缘选择，直接互惠、间接互惠、空间互惠，以及群组选择等。我们从下面几个角度分别讨论合作演化的机理。
直接互惠直接互惠：通俗的理解就是 “今天我帮你，明天你帮我”，他指的是两个个体间相互帮助的情景。这个合作的模式需要两个个体有重复博弈的机会。重复博弈的机会越大合作的机会就越大，显正相关性。依据这个模型设计的一个典型的策略就是“针锋相对”。他是由英国数学家、生物学家R a p o p o r t 提出的，并在A x e l r o d 锦标赛中夺冠。其策略非常简单：初始博弈的时候个体采取合作策略，然后在接下来的演化中，个体都将重复对手上一步所使用的策略，即针锋相对，或者说以牙还牙。研究结果表明，这种策略能够有效地抑制背叛策略的传播和蔓延。但这种策略也

囚徒困境的破解方法

囚徒困境的破解方法囚徒困境是一种经典的博弈理论，描述了两个合作者在缺乏沟通和合作的情况下如何面对决策。

在这种情况下，每个人都面临着合作和背叛的选择，而选择的结果会直接影响到双方的利益。

如何在囚徒困境中找到破解的方法，是一个备受关注的问题。

下面将探讨一些破解囚徒困境的方法。

首先，要建立信任。

在囚徒困境中，缺乏信任是导致合作失败的主要原因之一。

因此，要想破解囚徒困境，首先需要建立起双方之间的信任。

只有建立了信任，双方才能够在合作中放下戒备，共同谋求最大化的利益。

其次，要加强沟通。

在囚徒困境中，缺乏有效的沟通是导致合作失败的另一个重要原因。

双方需要通过充分的沟通，了解彼此的意图和利益，才能够更好地协调行动，避免陷入背叛的局面。

此外，要建立长期合作的意识。

囚徒困境通常是一个单次博弈的情况，但在现实生活中，人们往往会面临多次博弈的情况。

因此，要想破解囚徒困境，双方需要树立长期合作的意识，不仅要考虑眼前的利益，还要考虑未来的合作机会，从而形成稳定的合作关系。

最后，要建立有效的激励机制。

在囚徒困境中，双方往往会因为利益的诱惑而选择背叛对方，因此需要建立起有效的激励机制，对合作者给予适当的奖励，从而增强合作的动力，降低背叛的成本。

总之，囚徒困境是一个复杂而又普遍存在的问题，要想破解囚徒困境，需要双方共同努力，建立信任、加强沟通、树立长期合作的意识，建立有效的激励机制，从而实现合作共赢的局面。

希望以上方法能够对破解囚徒困境有所帮助。

论文

打破“囚徒困境”——合作行为和社会发展囚徒困境作为博弈论的一个经典案例，涉及经济学、管理学、哲学等各种领域，囚徒困境不仅仅体现在《博弈论》一本简单的书本里，透过书本，我们也能抓住在实际生活中人与人合作的本质，我们在自以为选择了最优结果的时候，是否考虑到自己也许就是其中的一个囚徒呢。

囚徒困境经典案例分析囚徒困境的主要内容是说：两个嫌疑犯作案后被警察抓住，分别关在不同的屋子里接受审讯。

警察知道两人有罪，但缺乏足够的证据。

警察告诉每个人：如果两人都抵赖，各判刑一年；如果两人都坦白，各判八年；如果两人中一个坦白而另一个抵赖，坦白的放出去，抵赖的判十年。

于是，每个囚徒都面临两种选择：坦白或抵赖。

拿表格具体表现如下：甲抵赖甲坦白乙抵赖两人各判刑一年甲释放；乙判刑10年甲、乙两人判刑8年乙坦白乙释放；甲判刑10年如果他们可以串通则答案显而易见，甲、乙都抵赖同时获刑一年，但是两个囚徒一旦被隔离开，并且不可以相互交流，即任何一人在选择策略时都不知道另外一人的选择，于是在不可以交流的情况下，两个囚徒各人追求自己利益的最大化，双方难以确信对方可以“合作”，沉默可能被出卖获刑10年，坦白相对来说可能获刑8年甚至被释放，结果双方都选择了自己觉得合理的决定，结果两个都因为坦白各自获刑8年，他们达到了团体最优结果了吗？显然并没有。

郑也夫说过：“理性的个人，加在一起成了非理性的社会”。

“囚徒困境”告诉我们，个人理性和集体理性之间存在矛盾，基于个人理性的正确选择会降低集体的利益，我们在实现个人利益最大化的情况下，损害了集体的利益。

有人可能会认为：囚徒困境只是“象牙之塔”中的理论家虚构的一种“思想游戏”，或者根本不可能在现实发生的特例，这是一种对理论的极大错觉。

囚徒困境最初确实是“象牙之塔”中的“抽象理论思维”的产物，但是随着研究的深入，人们愈来愈感受到它同现实世界息息相关。

囚徒困境的实例解析在现实生活中，这种博弈时时刻刻在发生。

囚徒困境的推理方法基础

囚徒困境的推理方法基础
囚徒困境的解法：
一、双方达成合作协议：确保公平和正义。

合则两利，分则两伤。

在囚徒困境中，如果双方可以见面交流，达成合作，那么双方就会实现利益最大化。

这可见交流合作，达成协议，是解决囚徒困境的重要条件。

在双方达成合作协议时，一定要确保公平和正义。

不然协议纵使达成，一方不免心怀怨恨，极可能打破合作协议。

二、保证双方不变卦。

害人之心不可有，防人之心不可无。

为保证双方不变卦，双方可以寻找外部的权威人士来促成合作并守护公平。

当农民工遇到不良老板，恶意克扣及延发农民工工资，农民就会寻找劳动部门以解决纠纷。

此时，劳动部门就相当于外部的权威人士，保证了合作协议的进行。

“囚徒困境”的解决办法

一个决策过程：假如我招了, 他也作均衡实际上是陷入僵局的一种招了, 我们都坐5年牢。

我招了, 他均衡, 在这种均衡里, 双方都采取了不合作的态度, 每个人首先想到不招, 我就只坐3个月；他招了, 我的都是自己的利益, 进行的都是有不招, 我就会坐10年牢。

所以不管利于自己的选择决策, 但最后的结他招不招, 对我来说都是招了划果, 不仅没有使自己获利, 而且还算。

两个人都动了这样的脑筋, 最损害了对方的利益, 最后大家共同终都选择了招供, 结果都被判5年损失。

刑。

而原本对两人都有利的策略前些年, 我国彩电市场上, 为（抵赖）和结局（被判1年刑）则了各自利益的最大化, 每一个厂家不会出现。

都像囚徒那样进行了一番选择：我的家乡也有一个类似的故如果我降价, 我可以赢得更大的市事：两个人分别叫黑蛋和白蛋, 在场；如果我不降价, 别人降价了, 一个漆黑的夜晚要共同去装一车别人就会占领更大的市场。

因此粪。

黑蛋带了一把炭锨（加炭用不论别人怎样, 对于我来说, 降价的, 锨头不到巴掌大小）, 反正天都是最优选择。

当每一个厂家都黑看不见, 装作很卖力的样子, 每这样选择的时候, 彩电市场打起了往车上撂一锨粪, 嘴里就发出“嗨国外有一个故事：一天, 一一轮又一轮的价格战。

最后大家吆”的声音, 还把炭锨在车厢上个富翁在家中被杀, 财物被盗。

警都遭受到重大损失。

“咣”的磕一下。

白蛋也很卖力, 方在破案的过程中, 抓到两个嫌疑还有些企业, 为了利润最大嘴里使劲的同时, 车厢也发出很响犯汤姆和彼得, 并从他们的住处搜化, 降低员工待遇；而员工为了获的声音。

黑蛋暗自高兴, 并暗骂白出丢失的财物。

可他们矢口否认得高薪和自身发展, 频频跳槽, 结蛋傻瓜。

过了很长时间, 黑蛋用手曾杀过人, 于是警方将两人隔离审果双方都遭受损失。

去摸车厢, 还差很远。

后来又摸了讯, 分别对他们说, 你们的偷盗罪所以成功不是一个人的事, 几次, 车厢总不见满。

囚徒困境的论文

走出“囚徒困境”囚徒困境作为博弈论中的一个经典范例，其博弈理论逐渐被经济学、哲学、伦理学、管理学等诸多学科的研究所重视，辩证的看待这一研究现象，是促进人们深入研究相关社会现象的一种特殊的思维路劲和方法。

一、囚徒困境经典案例分析囚徒困境的内容是这样的：警方逮捕甲、乙两名嫌疑犯，但没有足够证据指控二人入罪。

于是警方分开囚禁嫌疑犯，分别和二人见面，并向双方提供以下相同的选择：若一人认罪并作证检举对方（相关术语称“背叛”对方），而对方保持沉默，此人将即时获释，沉默者将判监10年。

若二人都保持沉默（相关术语称互相“合作”），则二人同样判监半年。

若二人都互相检举（互相“背叛”），则二人同样判监2年。

用表格概述如下：们各自都有“不坦白”和“坦白”两种可选择的策略；因为这两个囚徒被隔离开，其中任何一人在选择策略时都不可能知道另一人的选择是什么，因此不管他们决策的时间是否真正相同，我们都可以把他们的决策看作是同时做出的。

博弈的结果是：由于这两个囚徒之间不能串通，并且各人都追求自己的最大利益而不会顾及同伙的利益，双方又都不敢相信或者说指望对方有合作精神，因此只能实现对他们都不理想的结果（各判2年），并且这个结果具有必然性，很难摆脱，因此这个博弈被称为“囚徒困境”。

“囚徒困境”告诉我们，个人理性和集体理性之间存在矛盾，基于个人理性的正确选择会降低大家的福利，也就是说，基于个人利益最大化的前提下，帕累托改进得不到进行，帕累托最优得不到实现。

但是这样的分析是基于单次博弈的基础之上，而在重复的囚徒困境中，博弈会被反复的进行，因而没个参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为。

这时，合作可能会作为均衡的结果出现。

欺骗的动机这时可能被受到惩罚的威胁所克服，从而可能导向一个较好的、合作的结果。

作为反复接近无限的数量，纳什均衡趋向于帕累托最优。

二、类似囚徒困境的经典案例分析在现实生活当中，信任与合作很少达到如此两难的境地，无论在自然界还是在人类社会，“合作”都是一种随处可见的现象。

囚徒困境的破解方法

囚徒困境的破解方法囚徒困境囚徒困境是博弈论的一个重要概念；意思是两个合谋犯罪的人被警察抓住，关在两个单独的牢房里，无法互相交流。

警方给了两名嫌疑人三个选择:一是两人都没有交代罪行，根据掌握的证据，各判两年；二是两人都坦白自己的罪行，根据已经掌握的证据和新坦白的罪行，可能判四年；第三，一个什么都没坦白，另一个罪犯选择背叛搭档，坦白自己的罪行。

认罪立功，当庭释放。

另一个将被判六年。

从共同利益出发，两个嫌疑人都守口如瓶，共同掩盖罪行，才是最好的结果。

他们每个人只在里面呆两年。

但从个人利益来说，你肯定是希望自己认罪，而你的同伙什么都不会告诉你，这样你就无罪释放了。

从个人角度来说，这是一个理性的选择。

但是，每个人都会这么想，都会考虑自身利益的最大化。

最终两人都供认了自己的罪行，但都没有被判无罪，加重了罪行，被判了四年。

人性是自私的；每个人都期望自己的利益最大化，但是这些追求自身利益最大化的理性选择，最终的结果是没有人获利。

对个人来说理性的决定对集体来说是不理性的。

在商业上，类似的案例比比皆是；创业，大家激情澎湃，勇往直前，企业利润蒸蒸日上。

不能长久；在利益面前，一些人开始盘算如何让自己的利益最大化。

于是，相互怯懦、荣辱与共的创业激情不再；取而代之的是团队之间的猜忌和内斗。

企业的经营也停滞不前，甚至分崩离析。

最终，短期内可能会有人的利益最大化。

但是集体利益严重受损。

长期来看，即使是那些短期可能盈利的，长期收益也会缩水甚至消失。

个人所谓的理性选择，导致集体利益的损失；如何解决囚徒困境，促使我们选择合作，在集体层面做出理性决策？密歇根大学数学心理学教授拉波波特发明了一个非常简单的策略:以眼还眼，以牙还牙。

具体来说，有两个步骤:1.一开始，选择合作。

2.在后续的沟通中，你要像他上次对待你那样对待他。

这就是所谓的“以眼还眼，以牙还牙”，用这个策略和对方互动几次之后，对方就会开始主动选择合作了，这就是囚徒困境的破解。

社会科学中的囚徒困境现象及其解-2019年精选文档

社会科学中的囚徒困境现象及其解、囚徒困境与外部性人是社会关系的总和。

所谓的“鲁滨逊”式的人只是一种假设世界无摩擦的理想世界，人类社会的进步史在一定意义上也是部社会的分工史。

从原始社会到现代社会，社会分工已经极度精细化。

而这种分工不是说人们之间的合作减少了，相反地，这种分工是建立在更为紧密的合作的基础之上：人们通过分工生产更为专业化的商品，用来同其他人生产的商品进行组合，生产出最终产品；或者与其他人生产的商品进行交换获得自己需要的产品。

从这个意义上来说，“合作”是人类社会的主题之一。

但现实世界中，人类很多的行为会伤害到他们之间的合作，如欺诈、掠夺、偷盗以及敲竹杠(holdup) 以及搭便车(free rid ，er) 等，我们称这类行为具有外部性(externality) 。

现实世界中，人们的行为选择都或多或少地具有外部性特征，当我们把外部性问题形式化表达时，发现它们大多可以表达为囚徒困境(prisoner's dilemma) 的形式。

囚徒困境中每个囚徒的行为选择都会影响到另一个人的收益，如一囚徒选择合作(不坦白) ，则此行为对另一囚徒具有正的外部性；如他选择不合作( 坦白) ，则会给另一囚徒带来负的外部性。

当行为选择具有正的外部性，而又不能保证这种正外部性的排他性”和“竞争性”时，这种正的外部性则会带来搭便车行为，因为其他人可以不付出或少付出努力就可获得外部性收益。

而搭便车行为就是一个典型的囚徒困境问题。

当行为选择具有负外部性时，若没有合适的机制来对此进行制约，则会造成私人成本与社会成本的不一致，从而个人利益的最优会损害社会利益的最优。

而个人利益与社会利益的不一致正是囚徒困境表达的内容：当每个囚徒都追求个人利益最大化时，选择不合作策略是一个严格占优策略，尽管这种策略不是社会最优的。

这也表明，这种外部性问题可以形式地表达为囚徒困境问题。

囚徒困境问题部分地否定了Smith 的思想。

Smith(1776) 认为，人们在追逐个人利益时，会在无意中促进整个社会利益；而囚徒困境问题告诉我们，个人在追求个人利益时，常常损害了社会利益。

【项目管理知识】让管理者摆脱“囚徒困境”

让管理者摆脱“囚徒困境”随着市场竞争的深入，企业管理从粗放到规范精细成为一种必然，然而实践中的精细化程度总是难以尽如人意。

管理者并非不知道管理规范性和精细化的好处，只是缺乏践行管理精细化的推动力，常常陷入“囚徒困境”式的选择，担心难以实现预想的价值均衡而白费精力。

因而促使管理者摆脱“囚徒困境”，克服通过粗放管理侥幸取胜的诱惑，应当成为管理精细化的当务之急。

管理者的选择困惑负责任的管理者当然明白“细节决定成败”的道理，然而他们也深知在社会经济体制转换的过渡阶段，实行精细化管理的同时也要防止别人粗放式管理的侵袭。

这就使我们想起了西方经济学中经常提及的“囚徒困境”。

在两个被分别关押的囚徒之间，他们将受到的制裁的轻重不仅取决于自己的认罪态度，也取决于同伙的认罪态度。

为了减轻自己所可能受到的制裁，在同伙间缺乏合作诚信，又无法沟通的情况下，每个囚徒都在决定自己是坦白还是不坦白的策略选择上左右为难，这就是所谓的“囚徒困境”。

如此说来，管理者在“囚徒”式的困境中，精细化管理就相当于囚徒的“坦白”，继续实行粗放式管理就相当于“不坦白”。

“囚徒困境”中所反映的关联性：“两个自由意志可以自行选择影响到双方的策略”，必然反映在单个企业实行精细化管理的策略选择上。

也就是说，实行精细化管理能否取得优效果，并不是单个管理者能够完全把握住的事情。

假如甲企业的管理者准备通过精细化管理提高企业效益，但是他并不知道乙企业的管理者是否也和自己一样放弃粗放式管理，如果乙企业继续实行粗放式管理能够不断扩大市场份额，而甲企业单独实行精细化管理反而受到挤压，甲企业的管理者选择实行精细化管理的策略就会感到风险很大，缺乏实行和继续坚持管理精细化的动力。

摆脱选择困惑的途径加大对品牌精品的支持力度，促进社会资源的组合。

管理者努力推进和实践管理精细化，一方面需要树立靠质量取胜的坚定信念和为社会多做奉献的价值追求，真诚地承担起应尽的社会责任，把管理精细化当作事业来做，而不是像“囚徒”那样把“坦白”当作减刑的策略。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

摆脱“囚徒困境”对策研究【摘要】“囚徒困境”是博弈论中的一个经典案例，对这个问题的研究涉及经济学、政治学、社会学、哲学、伦理学等广泛的领域。

本文通过分析“囚徒困境”及其假设条件，找出“囚徒困境”的缺陷，进而结合案例提出摆脱“囚徒困境”的方法。

【关键词】“囚徒困境”；理性人；信息不对称；重复博弈一、“囚徒困境”的含义及其提出博弈论是西方经济学中的重要理论，而“囚徒困境”是博弈论中的一个经典案例，人们经常运用“囚徒困境”来分析一些实际问题。

在现实世界中，“囚徒困境”也是随处可见，正所谓”你我皆囚徒，何处无困境”。

（一）定义“囚徒困境”（prisoner’s dilemma）是指两个被捕的囚徒之间的一种特殊博弈，说明为什么甚至在合作对双方都有利时，保持合作也是困难的①。

（二）提出及其模型分析1950年，由就职于兰德公司的梅里·弗勒德（Merrill Flood）和梅尔文·德雷希尔（Melvin Dresher）拟定出相关困境的理论，后来由顾问艾伯特·塔克（Albert Tucker）以囚徒方式阐述，并命名为“囚徒困境”。

“囚徒困境”是博弈论的经典案例，常被用来解释生活中的一些现象，如公共物品提供不足，垄断行业价格同盟的破坏等[2]，它的具体内容如下：两个嫌疑犯A、B 合伙作案后被警察抓住，由于缺乏足够的证据指证他们所犯的罪行，分别把他们关在不同的屋子里审讯以防止他们串供。

警察分别告诉他们：如果两个人都认罪坦白，各判八年；如果两个人都抵赖不坦白，各判一年（或许因证据不足）；如果其中一人坦白另一人抵赖，坦白的被释放，不坦白的判刑十年（“坦白从宽，抗拒从严”）。

在两个囚犯都是理性人的前提假设下，囚犯A会进行权衡抉择：如果B坦白了，A选择坦白被判8年，不坦白被判10年，坦白是优势策略；如果B不坦白，A坦白被释放，不坦白被判1年，同样对于A来说坦白是优势策略，这样A 就选择了坦白。

囚犯B基于同样的考虑，也选择了坦白，两人都被判8年。

易知囚徒双方都独立地追求个人利益最大化，坦白成为了两个囚徒的优势策略，是唯一的纳什均衡：（坦白、坦白），其结果是（- 8，- 8），但是最终却未能达到帕累托最优的集体利益最大化结果（- 1，- 1）。

显然如果两个囚徒都抵赖，下场会好于都坦白，两人只会被判1年而不是8年，即好于纳什均衡的情况。

两个囚徒陷入了“求之不得”却又“身不由己”的困境[3]。

二、“囚徒困境”的缺陷（一）给定他人的战略条件不充足“囚徒困境”这一模型中，给定他人的战略条件不充足，因为当囚徒A看到对方“抵赖”时囚徒A选择坦白，实际上囚徒B同时也在考虑这个问题，B想到A 选择坦白，囚徒B就不会选择“抵赖”，这样你假设的“给定他人的战略”就变了，成了他人的战略不确定[6]。

这个模型虽然是静态博弈，但是博弈双方考虑整个过程时都在模拟对方的选择，这其中有动态的成分（你假设对方抵赖，你选择坦白，实际对方猜到你选择坦白，他会改变自己的策略不再抵赖也选择坦白，最后达到均衡（坦白，坦白），这个决策过程有先后顺序，实际上是动态博弈过程），所以完全按照静态博弈方法分析会有问题，导致“囚徒困境”的产生。

（二）博弈双方并不是真正的理性人“囚徒困境”博弈模型中个体理性和集体理性的冲突对经济学的基本假设——“理性经济人”造成了严重挑战。

其实“囚徒困境”中之所以出现个体理性导致了集体的非理性，这种表面的理性冲突是因为囚徒并非真正“理性人”[7]。

双方相互不能猜透对方，从而各自只能采取自己的优势策略。

如果是两个嫌疑人都是理性人，而且都是博弈论专家，他们相互理解对方且确信对方的策略，最后博弈均衡就会变为（抵赖，抵赖）。

所以说参与人实际上是不完全理性的。

（三）利己主义者的前提不成立有人认为“囚徒困境”的产生源于利己主义，而在小说《麦琪的礼物》中吉姆和德拉在圣诞节都想给对方买礼物，因拮据吉姆卖了心爱的金表，买了漂亮发卡，德拉卖了心爱的头发，买了表链和表袋。

但是失去了头发的德拉得到了漂亮发夹也无法发挥发夹的作用，同样，没有了金表，吉姆得到的表链也变得毫无价值。

他们无私利他的选择却使两人的利益受损，可见“囚徒困境”无须受限于利己的假设，只要局中人受非理性因素（感情、信念、同情心等）的影响，就无法避免个体理性和集体理性的矛盾[8]。

三、摆脱“囚徒困境”的途径（一）利用强化的力量当出现“囚徒困境”时，靠囚徒们的自律，并不总是能够走出困境。

一个鲜活的例子是中国彩电企业首次“价格联盟” 的失败[9]，当不合作有很高的“利润” 诱惑时，没有哪家企业愿意合作。

此时政府可以通过制度、政策、奖惩措施等强化手段约束成员的个人理性与行为，鼓励和激发创新与奉献，通过强化手段的诱发和约束，加大群体成员进行更具建设性选择的酬赏与份量，引发成员在引入了新的强化因素后做出更具合理性的个人选择，打破原有利益格局中的纳什均衡，建立起更有利于群体进化和群体成员利益的新的“纳什均衡”，克服多人“囚徒困境”所带来的群体内耗[10]。

例如当两家烟草公司——万宝路与骆驼用广告来吸引相同的顾客时，它们面临与“囚徒困境”类似的问题，并且最终走出困境的方法也颇具意义。

如果两家烟草公司都不做广告，它们瓜分市场。

如果两家公司都做广告，它们依然瓜分市场，但利润减少了，因为每家公司都要承担广告费用。

但如果一家公司做广告而另一家不做，做广告的一家就把另一家的顾客吸引走了，不做广告的一家利润就会减少。

做广告是骆驼和万宝路两家公司的优势策略，所以两家公司都选择了做广告，但其实两家企业都不做广告，状况会更好，分别得到40亿美元利润而不仅仅是30亿美元利润。

这种广告理论的检验出现在1971年，当时美国国会通过了禁止在电视上做香烟广告的法律。

另许多观察者奇怪的是，烟草公司并没有利用他们在政治上相当大的影响力去反对这项法律。

当该法律实施后，香烟广告减少了，烟草公司的利润却增加了。

这项法律为烟草公司做了一件它们自己做不到的事：它通过强制禁止实现了低广告高利润的合作，成功解决了“囚徒困境”问题。

（二）由外部环境决定的依存关系有可能使双方摆脱囚徒的困境有时候，由于来自外部环境的威胁，进行“囚徒困境”博弈的两个囚徒之间的合作（抵赖、抵赖）可能作为一种受迫性反应而出现[11]。

还是“囚徒困境”中的两个囚徒A、B，不同的是这里假设A、B被抓前一起得罪过一个流氓C，囚徒A、B 都知道若他们同在一起生活，C不敢报复（可能是A、B 在一起，实力较强，C 斗不过），但若A、B 有一个在监狱中，另一个在社会上一定会遭到C 的报复而得- 2 单位的支付。

C 报复A、B 之一可得到4 单位的支付，不实施报复可得零单位支付。

此模型用逆向归纳法很容易地解出此两阶段动态博弈的唯一纳什均衡②是：A 抵赖，B 抵赖；C 当A、B 不合作时报复其中坦白者。

均衡结果是（- 1，- 1，0），均衡时该博弈实际上不会进入第二阶段，也即囚徒A、B 不会给C 以报复的机会[12]，这或许可以解释如下事实：当村民们修公共防水堤时，人们的劳动力供给成了公共物品，当未涨水时，人们懒散、窝工现象严重，陷入“囚徒困境”，公共防水堤的质量不高；当涨水且岌岌可危时，人们更加齐心合力修建水堤，公共防水堤的质量明显提高，走出了囚徒的困境。

以上例子说明：来自外部的竞争压力会凸显集体的重要，合作可以作为一个受迫性反应出现[13]，从而迫使囚徒进行合作而走出困境。

（三）运用“重复博弈”走出“囚徒困境”囚徒两难的困境抓住了人与人之间不信任和需要相互防范背叛这种真实的一面，但是在现实世界里，信任与合作很少达到如此两难的境地。

无论在自然界还是在人类社会，合作都是一种随处可见的现象。

通过无限次重复博弈，合作的可能性增强，就有可能走出困境。

假定有甲、乙两个厂商，他们都以追求自身利润最大化为目的并且不能控制对方的决策。

他们签有100万元的商品购销合同。

在合同即将履行前，来了一位“倒爷”，分别对这两个厂商的主要负责人施以小利并游说它们：如甲厂商将商品销给“倒爷”则甲厂商可获得120万的收入，但乙厂商则不得不以更高的价格获得这些商品从而使得乙厂商获益减少至60万；或者如果乙厂商从“倒爷”手中价购入可获得120万的收益，但甲厂商则只能低价出售从而使其获益减少至60万；或者两厂商同时违约分别从“倒爷”手中购销该产品从而使“倒爷”获取渔翁之利，致双方获利都降至80万。

显然，如果甲乙双方做的是“一锤子买卖”[14]，对于甲乙厂商来说，他们的优势策略是选择违约，但实际上如果双方选择守约实行合作，将获得100万的收益而不仅仅是80万，双方陷入“囚徒困境”最终导致资源的浪费和效率的降低。

如果甲乙厂商是长期合作伙伴，那么“囚徒困境”就会迎刃而解，因为甲乙厂商会进行多次重复博雾，产生了新的动力结构，违约不再是优势策略。

在重复性“囚徒困境”下，理性博弈者将考虑：如果我拒绝合作，执行背叛，为了减少你的损失你也会背叛。

如果博弈者不仅关心眼前收益也关心未来收益，而且博弈没有确定的时间限度，被惩罚的威胁似乎足以高到保证每一博弈阶段的稳定合作。

这样，每个厂商都理性地克制投机行为，进行重复博弈和长期合作，实现双方策略上的“合作均衡”和综合利益最大化，将成为他们的最优选择。

每一厂商会努力在重复博弈中建立起自己的好名声，减少道德风险，降低交易成本，以较低的边际成本获取较高的边际收益。

他们深知，要是欺骗的话最多在博弈中只能占一次便宜，如上表中所示，得到120万，这比守约的报酬多20万，但这一欺骗却带来了长期的损失。

所以一方面，重复博弈使得博弈双方都在更大程度上了解了对方的信息，使得更多的私人信息变为博弈双方的公共信息。

另一方面，重复博弈使得“一报还一报”式的报复得以实现。

“一报还一报”[15]式的报复指的是博弈一方永远不先背叛对方，而且还会在下一轮中对对手的前一次合作给予回报，但它也会采取背叛的行动来惩罚对手前一次的背叛。

这样囚徒在经过多次博弈之后，它们采取合作的态度逃避法律制裁的可能性就会大大增强，就有可能走出“囚徒困境”。

参考文献：[1]曼昆.经济学原理[M].机械工业出版社，2003（8）.[2]张维迎.博弈论与信息经济学[M].上海人民出版社，2004（11）.[3]冯晓明.寡头垄断市场竞争下的“囚徒困境”与突破策略[J].合作经济与科技，2011（2）.[4]王玉珍.理性只是对自利最大化的追求吗[J].经济学家.2004.（6）：84—89.[5]高鸿业.微观经济学（第3 版）[M]，中国人民大学出版社.[6]郭洪伟.“囚徒困境”的均衡辨析[J].技术经济与管理研究，2011（2）.[7]崔志军.浅析“囚徒困境”模型中的“理性”假设[J].经济研究☆，2011（12）.[8]李伯聪，李军，关于”囚徒困境”的几个问题[J]，自然辩证法通讯，1996（4）[9]陶章华.企业“竞争—合作” 博弈研究[J].西南交通大学博士学位论文（98 级）.[10]曼瑟尔.奥尔森.集体行动的逻辑[M].陈郁等译.上海：上海人民出版社，1995.13.[11]朱晓宁，赵爽.“囚徒困境”下的抉择[J].商业文化学术探讨，2007（4）[12]马本江，邱菀华.论摆脱“囚徒困境”的途径[J]，生产力研究.，2004（10）.[13]刘辉.人才群体中的“囚徒困境”及其克服[J].中国人才，1999，（1）：13-15[14]代礼忠，翟江涛.重复博弈的制度安排：走出信用制度建设“囚徒困境”的必由之路[J]，甘肃理论学刊，2005（5）.[15]周厚虎.运用“重复博弈”走出“囚徒困境”[J]，探索，2011（1）.注释：①曼昆的《经济学原理》里指出“囚徒困境”是两个被捕的囚徒之间的一种特殊博弈，说明为什么甚至在合作对双方都有利时，保持合作也是困难的。