如何走出囚徒困境
走出囚徒困境

囚徒困境博弈
囚徒困境
这些社会困境大多可用著名的囚徒困境囚徒 B 坦白
-8,-8
抵赖 0,-10
抵赖 -10,0 -1,-1
社会困境的基本类型
负向的相互作用,一个参与人的行动给其他参与人 带来了损失,但他却没有进行补偿。如价格竞争、 虚假伪劣商品、军备竞赛;
公地悲剧(哈丁,1968) ,无法分解的公共资源 被过度使用。如渔业资源枯竭、交通拥堵、环境污 染;
走出囚徒困境
广泛存在的社会困境
在市场交易、企业管理、社会交往、政治运动 与战争中,人们经常会陷入到某种社会困境中:
酷烈的价格战和军备竞赛,全球渔业资源枯竭和 公地悲剧,交通拥,高考以及研究生考试越来越 激烈的竞争,假货泛滥以及旅游市场的混乱,养 老、医疗、教育等公共服务严重不足。
那么,我们如何才能走出这些困境?
可以证明,在贴现因素δ 较大时,双方采用冷酷策略构 成一个子博弈精炼纳什均衡。
冷酷策略是均衡解的证明
假设博弈方1已经采用了冷酷策略。
如果博弈方2 也选择冷酷策略,那么他们每次都是合作
结果,则总得益的现值是:
1 4 *4 2
*
4
......
1
4
• 如果博弈方2不采取冷酷策略,在第一阶段采用L,因为 第二阶段起被报复只能采用L, 因而得益为(5,1,1,...)。总 得益的现值是:
例如商业活动中的回头客:商店和顾客的每次交易都 是一次独立博弈,但双方在每次交易时,会考虑对以 后交易的影响。
我们把这种重复博弈理解成一个序贯博弈,更能反映 问题的实质。
重复的囚徒困境博弈
坦白 囚徒 1
不坦白
囚徒 2
要知道如何走出囚徒困境

要知道如何走出囚徒困境,首先要知道为什么会产生囚徒困境。
如果两个人都选择不招供,每个人最多只坐两年牢,时间损失最小。
但两名囚徒在不能串谋的条件下,谁都不知道对方会做出什么选择,我们知道两个囚犯都是自然人,都有私心,每个囚犯都以追求可预期的自身利益最大化为目标,那么选择不招供的策略显然是一种不理性的行为,所以他们都会选择占有策略,那么就是招供,这样不管对方做出什么反应自己都不会吃亏,所以从非合作博弈的角度来看,虽然两败俱伤,但每人都招供是这次博弈的均衡解。
可是这并不是最好的结果,如果两人都选择不招供,则时间损失就会最小。
那么要走出囚徒困境,首先,要懂得合作,合作才能共赢,囚徒困境问题在于个体利益与集体利益之间的冲突,而人们往往只会以自我为重,所以得到的比失去的少了许多。
所以我们要把这种冲动化为理性,三思而后行,找出能实现共赢的路子。
博弈各方必须尊重对方的合理利益,通过利益分享创造多赢,并使合作长期化。
在生活中,一般人的思想都是:自己如何才能取得最大的利益。
如果当事人双方都这样想,那么就会陷入囚徒困境,使自己处于劣势。
我们要以长远的目光来看问题,不能鼠目寸光,现在社会所追求的是共赢,是更深更远的合作;其次,外部制度环境建设十分重要;在存在着外部性, 信息不对称,或产权关系不明晰的现实社会和经济中, 人们有可能通过转嫁成本和凭空受益去实现个人所追求的成本更小、收益更高的目标。
而如果人们不需要承担他们应该承担的成本, 不能获得他们应该获得的利益, 就不能实现资源的最优配置。
或者说, 交易的结果可能使交易一方或多方受损。
这就使得个人理性与集体理性之间发生了冲突;再次,可以设立附加的可置信承诺;最后,信息不对称也是导致"囚徒困境"的另一个罪魁祸首,所以应通过充分的交流和沟通,消除博弈各方彼此间的不信任感。
公共资源的过度使用公共品的提供:如果是公共走廊过道上的灯坏了,就很长时间没人理,每个人都有能力更换灯泡,但大家都在忍受黑暗的痛苦,都想着等别人花钱自己搭车应试教育:几乎所有的教育学家都明白我们的教育过于侧重应试教育,这样对国家的人才培养是极其不利的,但是现实是应试教育却愈演愈烈,素质教育可以被学校选择,但是没有多大的生存空间。
第三讲 囚徒困境和破解之道

分和所利(得)的部分哪个更多。(盗窃与抢劫)
特别提示:
如果有一种制度,在该制度下,每个人都只
能通过利人才能实现利己的目标,这一定是
一种好的制度。(市场的逻辑)
第六章 真实世界的囚犯困境
第一节 大萧条与凯恩斯革命
一、大萧条
工业产值下降 物价下跌 平均失业率 (1929-1932) (1929-1932)(1930-1938)
美国
英国
50%
10%
30%
25%
18%
15%
德国
法国
40%
30%
30%
40%
20%
10%
第一节 大萧条与凯恩斯革命
二、凯恩斯对大萧条的解释
1、消费需求不足 2、投资需求不足
3、ቤተ መጻሕፍቲ ባይዱ格刚性
第二节 价格战
第三节 独裁与多数人的懦弱
在美国波士顿犹太人屠杀纪念碑上,刻着德国新教牧师 马丁·尼莫拉的一段忏悔:“他们先是来抓共产党人,
一、我所记忆的建国后开展的历次运动: (1)土地改革运动 (2)镇压反革命运动 (3)抗美援朝运动 (4)建国后第一次整风运动 (5)连队民主运动 (6)三查运动 (7)忠诚老实政治自觉运动 (8)清理“中层”运动 (9)民主改革运动 (10)电影《武训传》和宣传武训的批判运动 (11)三自革新学习与教会民主改革运动 (12)农业生产互助合作运动 (13)文化教育战线和各种知识分子自我教育和自我改造运动 (14)反贪污、反浪费、反官僚主义的三反运动 (15)文学艺术界整风学习运动 (16)爱国增产节约运动 ----摘录于胡甫臣《对建国后历次政治运动的认识》
对称条件下的囚犯困境
在一个2人双策略对称博弈中,如果满足以下条件:
“囚徒困境”的解决办法

一个决策过程:假如我招了, 他也作均衡实际上是陷入僵局的一种招了, 我们都坐5年牢。
我招了, 他均衡, 在这种均衡里, 双方都采取了不合作的态度, 每个人首先想到不招, 我就只坐3个月;他招了, 我的都是自己的利益, 进行的都是有不招, 我就会坐10年牢。
所以不管利于自己的选择决策, 但最后的结他招不招, 对我来说都是招了划果, 不仅没有使自己获利, 而且还算。
两个人都动了这样的脑筋, 最损害了对方的利益, 最后大家共同终都选择了招供, 结果都被判5年损失。
刑。
而原本对两人都有利的策略前些年, 我国彩电市场上, 为(抵赖)和结局(被判1年刑)则了各自利益的最大化, 每一个厂家不会出现。
都像囚徒那样进行了一番选择:我的家乡也有一个类似的故如果我降价, 我可以赢得更大的市事:两个人分别叫黑蛋和白蛋, 在场;如果我不降价, 别人降价了, 一个漆黑的夜晚要共同去装一车别人就会占领更大的市场。
因此粪。
黑蛋带了一把炭锨(加炭用不论别人怎样, 对于我来说, 降价的, 锨头不到巴掌大小), 反正天都是最优选择。
当每一个厂家都黑看不见, 装作很卖力的样子, 每这样选择的时候, 彩电市场打起了往车上撂一锨粪, 嘴里就发出“嗨国外有一个故事:一天, 一一轮又一轮的价格战。
最后大家吆”的声音, 还把炭锨在车厢上个富翁在家中被杀, 财物被盗。
警都遭受到重大损失。
“咣”的磕一下。
白蛋也很卖力, 方在破案的过程中, 抓到两个嫌疑还有些企业, 为了利润最大嘴里使劲的同时, 车厢也发出很响犯汤姆和彼得, 并从他们的住处搜化, 降低员工待遇;而员工为了获的声音。
黑蛋暗自高兴, 并暗骂白出丢失的财物。
可他们矢口否认得高薪和自身发展, 频频跳槽, 结蛋傻瓜。
过了很长时间, 黑蛋用手曾杀过人, 于是警方将两人隔离审果双方都遭受损失。
去摸车厢, 还差很远。
后来又摸了讯, 分别对他们说, 你们的偷盗罪所以成功不是一个人的事, 几次, 车厢总不见满。
走出囚徒困境的方法

走出囚徒困境的方法走出囚徒困境是囚徒困境理论中的一种博弈策略,目的是通过合作而达到双赢的结果。
在囚徒困境中,两名囚犯面临着合作与背叛的选择,而他们的选择会影响到自己和对方的利益。
在博弈中,囚徒之间往往会因为互相不信任而无法合作,导致最终双方都会选择背叛,得不到最优利益。
然而,通过一些方法和策略,我们可以尝试走出囚徒困境,实现合作的局面。
以下是一些可能的方法:1. 互信建立:在囚徒困境中,缺乏互信是导致背叛行为的主要原因之一。
因此,建立互信是走出困境的关键。
可以通过多次合作而逐渐建立互信,或者通过个人交流和沟通来减少误解和不信任。
2. 共同利益的确立:为了走出囚徒困境,双方需要认识到彼此的共同利益。
只有意识到合作对双方都有好处,才会更有动力选择合作。
因此,需要明确表达共同的目标和利益,以激发囚犯们的合作动机。
3. 合作约束的设立:为了增加合作的可能性,可以引入一些合作约束。
例如,设立一个规则或约定,双方必须遵守合作原则,在确定的条件下共同决策。
这样可以提供一种制约机制,减少背叛的可能性。
4. 长期思维:在囚徒困境中,双方往往会陷入短期利益最大化的思维,导致最终陷入困境。
通过引入长期思维,囚犯们可以意识到合作的长远好处,从而更有动力选择合作。
可以通过宣传教育,让囚犯们意识到合作的长远利益,从而改变他们的行为。
5. 多次博弈的机会:为了增加合作的机会,可以提供多次博弈的机会。
通过多次博弈,囚犯们可以逐渐建立信任,积累经验,并且有机会改变策略。
多次博弈可以为双方提供尝试合作的机会,从而逐渐改变困境。
6. 外部监督与奖惩机制:引入外部监督与奖惩机制可以促使囚犯选择合作。
通过设立奖励机制,对合作行为给予积极激励;同时,对背叛行为进行惩罚,以增强合作的动力。
外部监督与奖惩机制可以起到约束和引导作用,帮助囚犯们走出困境。
总的来说,走出囚徒困境需要通过建立互信、确立共同利益、设立合作约束、引入长期思维、提供多次博弈机会以及引入外部监督与奖惩机制等方法。
囚徒困境的破解方法

囚徒困境的破解方法囚徒困境囚徒困境是博弈论的一个重要概念;意思是两个合谋犯罪的人被警察抓住,关在两个单独的牢房里,无法互相交流。
警方给了两名嫌疑人三个选择:一是两人都没有交代罪行,根据掌握的证据,各判两年;二是两人都坦白自己的罪行,根据已经掌握的证据和新坦白的罪行,可能判四年;第三,一个什么都没坦白,另一个罪犯选择背叛搭档,坦白自己的罪行。
认罪立功,当庭释放。
另一个将被判六年。
从共同利益出发,两个嫌疑人都守口如瓶,共同掩盖罪行,才是最好的结果。
他们每个人只在里面呆两年。
但从个人利益来说,你肯定是希望自己认罪,而你的同伙什么都不会告诉你,这样你就无罪释放了。
从个人角度来说,这是一个理性的选择。
但是,每个人都会这么想,都会考虑自身利益的最大化。
最终两人都供认了自己的罪行,但都没有被判无罪,加重了罪行,被判了四年。
人性是自私的;每个人都期望自己的利益最大化,但是这些追求自身利益最大化的理性选择,最终的结果是没有人获利。
对个人来说理性的决定对集体来说是不理性的。
在商业上,类似的案例比比皆是;创业,大家激情澎湃,勇往直前,企业利润蒸蒸日上。
不能长久;在利益面前,一些人开始盘算如何让自己的利益最大化。
于是,相互怯懦、荣辱与共的创业激情不再;取而代之的是团队之间的猜忌和内斗。
企业的经营也停滞不前,甚至分崩离析。
最终,短期内可能会有人的利益最大化。
但是集体利益严重受损。
长期来看,即使是那些短期可能盈利的,长期收益也会缩水甚至消失。
个人所谓的理性选择,导致集体利益的损失;如何解决囚徒困境,促使我们选择合作,在集体层面做出理性决策?密歇根大学数学心理学教授拉波波特发明了一个非常简单的策略:以眼还眼,以牙还牙。
具体来说,有两个步骤:1.一开始,选择合作。
2.在后续的沟通中,你要像他上次对待你那样对待他。
这就是所谓的“以眼还眼,以牙还牙”,用这个策略和对方互动几次之后,对方就会开始主动选择合作了,这就是囚徒困境的破解。
囚徒困境与走出囚徒困境

囚徒困境与走出囚徒困境引言:在一堂课中,一个小组讲到了囚徒困境这问题,老师当堂随机提问了两位同学,一位同学的回答是选择背叛检举对方,另一位同学的回答是不检举对方。
而我所说的“另一位同学”也就是我,当这个问题出现的时候,我的脑海里先浮现的是不检举对方,对于这个问题,我就在考虑如果我背叛了对方,那么我么两个人的刑期之和将会大大增加,如果我不检举对方,对方也不检举我,那么我们两个人将会之服刑期一年,这样我们两个人也就是一个集体所能够达到的利益才是最大的。
但是在博弈论中,按照纳什均衡的理论,我的这个选择说明我不是一个理性的个体,所以我将会在此讨论一下囚徒困境的问题一、囚徒困境囚徒困境是这样一个问题,问题的背景是警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。
于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:若一人认罪并作证检控对方(也就是背叛对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
若二人都保持沉默(也就是双方合作),则二人同样判监1年。
若二人都互相检举(背叛),则二人同样判监8年。
表格1囚徒困境结果乙合作乙背叛甲合作甲1年,乙1年甲10年,乙0年甲背叛甲0年,乙10年甲8年,乙8年这个困境成立的条件:1.甲乙两人分开囚禁,不能互通信息2.两个人都知道规则与结果3.每个人都是一个理性的个体。
所以大部分人在看到这个问题的时候都会有这样的分析:如果对方选择合作,我选择合作,那么我们都会一年刑期,我选择背叛呢,那么我将会被释放。
如果对方选择背叛,我也只有选择背叛才会让自己的兴起最短。
根据纳什均衡,每个囚徒都是理性的个体(即追求自身利益的最大化,并不关心其他人自身的利益),只会选择利益最大的一个选项(即背叛),这样的一个结果出现的一个基本条件就是两个囚徒并不能够相互串通,所以他们只能相互揣摩对方的心里来选择一个最佳的答案。
正是因为两个人面对的情况一样,两个理性的个人作出的选择也都一样,所以囚徒的困境才会出现(即两个人选择的结果都为背叛),也就达到了纳什均衡。
如何突破囚徒困境?

如何突破囚徒困境?1950年,美国普林斯顿大学数学家阿尔伯特•塔克(Albert tucker)编了一个故事向斯坦福大学的一群心理学家们解释什么是博弈论,这个故事后来成为博弈论中最著名的案例。
故事内容是:两个嫌疑犯(A和B)作案后被警察抓住,隔离审讯;警方的政策是“坦白从宽,抗拒从严”,如果两人都坦白则各判8 年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白则因证据不足各判1年。
那么,囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于被分开监禁,并不知道对方的选择;而且即使他们能订立攻守同盟,也未必能尽信对方不会反咬。
在现实中,这样的例子很多,两个人作案前发誓相约一旦被抓,要守口如瓶,不出卖对方,但在警方三审两审之后,就都扛不住招供了。
因为就个人的理性选择而言,出卖背叛对方所得刑期,总比沉默要来得低。
试设想困境中两名理性囚徒会如何作出选择:• 若对方沉默、我选择背叛会让我获释,所以我该选择背叛。
• 若对方背叛指控我,我也要指控对方才能得到较低的刑期——八年,所以也应选择背叛。
• 所以无论对方是沉默还是背叛,至少我能得到次好的结果——被判八年,但如果我沉默而对方选择坦白,则我将面临最坏的结果被判十年。
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。
背叛是两种策略之中的支配性策略,不依赖于对方的合作,不依赖于对方的守约行为。
因此,这场博弈中唯一可能达到的均衡,就是双方参与者都背叛对方,结果二人同样服刑8年。
在囚徒困境中,如果两个囚徒都拒绝坦白,则二人都能获得最少刑期一年,所以都不坦白,是能让两个囚徒获得共赢结果的唯一方案,也说明个人最佳选择并非团体最佳选择。
但如何才能得到最优的共赢结果呢?黑手党的招数曾非常有效地破解了警方设置的囚徒困境,首先,黑手党组织将忠实视为成员必须具备的最重要的品质,组织内的提升必会考虑其对组织的忠诚度,同时,一旦有组织成员出卖自己人,黑手党组织将不惜代价,天涯海角地追杀背叛者。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
专业:信息管理与信息系统学号:2010311957 姓名:董文举
合作才能共赢
——如何走出囚徒困境?
这个学期我学了运筹学这门课程,在佘老师孜孜不倦的教诲下,我学到了许多有用的知识。
对我影响最大的是博弈论部分,它用系统科学的方法分析和解决了我们身边的许多问题。
数学源于生活,运用于生活,有人说过一个国家的发展程度取决于这个国家对数学的应用程度。
学会运筹学中的方法可以让我们重新去考虑怎样把事情处理得更完美。
囚徒困境博弈作为运筹学中重要的问题之一,可以由此引出的问题非常多。
囚徒困境讲的是:警察抓住甲和乙两个小偷并把他们分别关押在两个囚室里,警察给两个小偷提供的选择有抵赖或者坦白,并告知两种选择的后果。
如果他们都抵赖,则会都被判处两年;如果两人中有一人坦白认罪,而另一人抵赖,则坦白者从轻处理立即释放,而另一人则判处十年;如果两人同时坦白认罪,则两人各
被判处五年。
具体情况如下表:
我们从上表可以清楚的看到两人选择后的后果是什么。
假设他们两个都是自然人,有私心,都希望自己比对方得到的更多,所以他们都选择坦白,两人要在囚室中度过五年。
但这不是最好的结局,这就是小偷的困境,自己给自己挖坑跳。
要如何才能避免这种困境呢?我认为他们没有合作,都以个人利益为主,没有考虑到集体利益,以至于走进别人安排好的陷阱。
要如何他们才会学会合作,者又是一个问题。
在条件允许的情况下,他们需要进行多次重复博弈,把遇到的困境想明白后他们才会考虑双赢而不是个人利益为主而走进陷阱里。
囚徒困境问题在于个体利益与集体利益之间冲突,而我们往往只会以自我为重,所以得到的比失去的少了许多。
所以我们要把这种冲动化为理性,三思而后行,找出能实现共赢的路子。
我们生活在社会的群体中,不可能不和别人打交道,也就是要和别人进行博弈,一般人的思想都是:自己如何才能取得最大的利益。
如果当事人双方都这样想,那么就会陷入囚徒困境,使自己处于劣势。
我们要以长远的目光来看问题,不能鼠目寸光,现在社会所追求的是共赢,是更深更远的合作。
大学生最关心的问题是以后的就业问题,能否找到好工作和大学期间的努力使成正比的,这也是一个博弈问题(假设是自己和竞争者之间努力与否的博弈,排除其他因素),问题如下表:
从上表我们可以看出,这个博弈的纳什均衡是两个都一起努力。
不努力的后果都是以后没有好的发展前途。
在我看来我们现在最值得考虑的博弈就是上面的问题,是关乎以后我们命运的博弈。
我们都知道“近朱者赤,近墨者黑”这句千古名。