S-囚徒困境与社会的基本问题
囚徒困境

囚徒困境”是博弈论中的经典对局,在经济学、政治学和道德哲学中得到广泛讨论和运用。
其大意是:两个被指控共同参与了某种罪行的囚徒被检察官分隔开来提审。
两人都知道如下选择:1、如果他们都不坦白,根据已有证据,两人都将判一年的监禁;2、如果两人都坦白,每人都将判两年监禁;3、如果一人坦白,另一个不坦白,坦白的人将被释放,而另一人将被判3年的监禁。
谁都不知道对方的选择。
对每个人来说,合理的选择是什么?如果每个囚徒要求得到他的最大效益,经过缜密推理,合理的选择应是坦白,但这样每个人都不能得到最好的结果,而是最坏的结果,即每人2年共4年的监禁。
“囚徒困境”通常被用以说明这样的道理:一个人自私地寻求最大效益并不意味着就能得到最好的结果,也不意味着由此可以促进公共的善。
相反,只有合作才能获得最好的结果。
这一道理被许多事实印证。
如我国家电销售商为使消费者多买自己产品,时常竞相降价、引发“价格大战”,其结果是“各败俱伤”,不仅谁也得不到最大利益。
而且利润日益走低甚至赔本。
可是如果他们在较高价格上形成某种默契,就都会得到不错的利润。
又如冷战时期超级大国起先不合作,都想凭军事实力压倒对方,结果被拖入昂贵的军备竞赛并面临核屠杀的危险,后来有了一些合作(如签订限制战略武器协议),这种恶性竞争的“囚徒困境”才有所缓解。
“囚徒困境”揭示的道理显然是从对局者即“囚徒”的立场说的,所以所谓没有促进“公共的善”,其实是指没有促进两个“囚徒”的共同利益。
但是如果我们换个角度,从设局者,即检察官、法官、警察等社会管理者出发,结论则恰恰相反,“囚徒困境”的结局不是没有促进,而是促进了真正的“公共的善”,即社会利益。
这样说的依据之一是罪犯受到了应有的惩罚,社会正义得以维护和伸张;依据之二是罪犯坦白意味自新的开始,这就有利于罪犯的改造,减少其以后再次犯罪或危害社会的可能。
令我感兴趣的是,设局者是如何让囚徒做出有利于社会的选择的?简单说来,这里靠的是两个制度安排。
新时期道德建设的“囚徒困境”

新时期道德建设的“囚徒困境”【摘要】新时期道德建设面临着“囚徒困境”,在道德观念多元化的背景下,社会环境对道德建设产生着深远影响。
个体的选择往往与集体利益发生矛盾,道德建设的长期性和艰巨性需要引起高度重视。
针对新时期道德建设面临的挑战,应采取相应的对策。
强调新时期道德建设的现实意义和重要性,探讨未来的发展方向,努力解决“囚徒困境”,推动社会道德建设步入新阶段。
【关键词】新时期道德建设、囚徒困境、道德价值观、社会环境、个体选择、集体利益、长期性、艰巨性、对策、现实意义、重要性、未来发展方向。
1. 引言1.1 新时期道德建设的“囚徒困境”在新时期,道德建设面临着许多困境和挑战,其中最为突出的是所谓的“囚徒困境”。
这一概念源自博弈论,指的是当每个个体都追求自身最大利益的时候,最终结果却对每个个体都不利。
在道德建设中,个体往往选择追求短期私利,而不考虑对整个社会以及未来的影响,导致道德标准的下降和价值观的扭曲。
新时期的道德建设“囚徒困境”具有以下特点:道德标准因为多元化和相对化而变得模糊不清,个体往往难以确定正确的道德选择;社会环境的变化和影响使得道德建设变得更加复杂和困难;个体的追求短期私利和集体利益之间的矛盾激化,导致道德观念的混乱和不稳定;长期性和艰巨性使得道德建设不可能一蹴而就,在不断的摸索和实践中寻求突破。
面对新时期道德建设的“囚徒困境”,我们需要深刻认识到问题的严重性和紧迫性,积极探索解决之道,推动道德建设迈向新的高度。
2. 正文2.1 道德价值观的多元化在当今社会,道德价值观的多元化是一个不可忽视的现象。
随着社会的不断发展和进步,人们的生活方式、观念和观点也在不断改变和多样化,这也直接影响了个体对道德的认识和认同。
现代社会的多元文化对道德价值观的形成起到了重要作用。
在一个多元文化共存的社会中,不同文化背景、宗教信仰和生活习惯都会影响个体对道德的理解和观念。
在一个多元宗教信仰的社会中,不同的宗教对道德规范和价值取向可能存在差异,这就导致了个体对道德的理解和选择也会有所不同。
03囚徒困境专题

第三讲纳什均衡应用---囚徒困境两个嫌犯受到指控,但除非至少一个招囚徒困境说明了什么在(坦白、坦白)这个组合中,A和B囚徒困境说明了什么囚徒困境反映了囚徒困境的意义“囚徒的两难选择对经典经济学的冲击《国富论》中,斯密认为,在利己心的驱动“———从“研究囚徒困境问题的目的生活中的例子1 商家价格战大厂商合谋将彩电价格维持高位,他们搞了一个“彩电厂家价格自律联盟”,并在深但是,尽管政府当时无力制止这种事情,公众也不必担心彩电价格会上涨。
例子为私人没有积极性出资修建公共设施修路博弈这就是我们看到的为什么大多数路、桥等公共设施都是由政府出资修建务的积极性和能力。
例子源经常被过度利用的原因。
由于草地的产权没有界定,政府也没有对放牧作出规模限制,每家牧民如果其他牧民约束放牧规模,我单独一家人过度放牧不会破坏广褒的牧类似的例子还有:渤海中的鱼愈来愈少了,工业化中的大公共资源悲哀公共资源悲哀 例子车鸣喇叭?但当对方缓行时,自己抢行会占便宜,获得支付9。
例子WTO是一个自愿性申请加入的自由贸易“囚徒困境”的一般表示用法律解决“囚徒困境”公共产品与税收制度因为私人没有积极性出资修建公共设施如果恰当进行机制设计,前述囚徒困境还是可以避免的,下面是一个商战中的真实例子。
机制设计:如何走出囚徒困境冻结价格战的博弈机制有人卖得比我们更低,我们的价格最低廉,我们保证价格最低,而且是超级疯你一生中于任何本地的销售商(本行销区内)那里发现相同的广告款式而价格争,根本不可能形成价格联盟,即使形成也难以维持,因而它们之间似乎是在但是,对手的战略锁定了“疯狂艾迪”的行为,因为“疯狂艾迪”的这一计划如果对手不想以250美元一台出售录相机,他也可以将价格降到275美元一这样,“疯狂艾迪”就没有进行价格战的意愿了,自然形成价格联盟。
在福州国美电器从谁价比我低,差价两倍还42智猪博弈猪圈中有一头大猪和一头小猪,在猪圈的一端设有一个按钮,每按一下,位于猪圈另一端的食槽中就会有10单位的猪食进槽,但每按一下按钮会耗去相当于2单位猪食的成本。
博弈论考试答案

2009——2010 学年第二学期《社会生活中的博弈论》试题学院:专业:姓名:学号:成绩:一:什么是“囚徒困境”,举出你对社会生活中观察到的“囚徒困境” 的例子。
答:囚徒困境是指在力求获得自己最好的结果时,却选到了不那么好的结果。
它说明了个体理性与集体理性的不同,也说明了只追求自身利益最大化的行为,有时会导致失去最大利益。
故事中两个囚犯面对的境况,就形象鲜明的说明白了。
举例:在此想特别说下目前中国改革开放取得了众多成就,经济实力也越来越雄厚。
但是我们在各种领域却没有什么创新。
在中国各种政治会议、科技会议、学校会议等等可以说都在说要有创新,可是有谁去创新了。
当官的所在科技上要创新,却不给科学家多少科研经费。
这难免成了一句口头语而已。
另外还有商家之间的价格战与广告战、中国的素质教育与应试教育、世界各国之间的核军备与核裁军等等事事只为己而不利人的事,就是“囚徒困境” 。
二:什么是非合作博弈?什么是合作博弈?分别举出它们的例子。
并说明为什么随着人类文明的发展合作博弈的情况越来越多。
答:1、非合作博弈是指博弈时完全不考虑其他博弈者的利益,只考虑如何获得自己的最大利益,并且常常是通过占有对方的利益来获得自己的利益。
当利益有限而博弈各方都只为自身着想时必然是合作博弈。
举例:下象棋、围棋、篮球、足球等双方性的比赛,以及法庭控辩、疆域之战等都为获得自己利益的最大化而未考虑对方的利益,就是非合作博弈。
在中国几千年的历史中,没有那一代人不喜欢赌博,而赌博就是非合作博弈的最极端的一种。
在中国人的心里就根深蒂固着有“小赌怡情,大赌伤身”的思想。
2、合作博弈是参加博弈的各方固然是要争取自己的利益,但又要注意他人的利益。
是在各方共同遵守一些约定,并在考虑整体利益的条件下去争取自己的最大利益。
同时在争取自己最大利益时,不会去破坏约定,不会不顾及整体利益。
因为只有在合作博弈中才能得到最大利益。
现实可行的个体利益的最大化与他人利益的最大化的理性结合的部分叫做合作博弈。
“囚徒困境”的引申与启示

“囚徒困境”的引申与启示作者:丁华来源:《职业时空》2007年第01期周洋韩雪峰什么是囚徒困境亚当·斯密讲了这样一个故事:有两个因巨额盗窃而正在服刑的囚犯A和B。
区检察官c 正在调查一宗悬而未决的银行抢劫案,并且他相信A和B就是罪犯。
区检察官c正在计划竞选州长,所以希望A和B认罪,因为这样会在他的记录中增加一项重要的定罪案件。
他依靠监狱警卫的帮助,对A和B的牢房进行了突击搜查,发现了隐藏的武器和毒品。
他知道可以利用这一信息控告他们犯有藏匿武器与毒品的小罪而使之被判刑,他将A和B隔离起来并分别对他们作出了如下承诺:如果无人坦白银行抢劫,他将以藏匿武器与毒品罪起诉并使两人各被再判2年监禁:如果两人都认罪,则都因银行抢劫罪而被再判5年监禁;如果只有一人坦白并将对方揭发出来,则对坦白者的抢劫银行与藏匿武器与毒品行为不予起诉并释放他,而没有坦白的人则会因抢劫银行与藏匿武器与毒品而被再判20年监禁。
那么,这两个囚犯该怎么办呢?从表面上看,他们应该互相合作。
如果选择抵赖,他们俩都能得到最好的结果。
但他们不得不仔细考虑对方可能采取什么选择。
对囚徒困境的引申与分析警惕公权力的滥用。
在上边的囚徒困境中,区检察官构造了一种情势,使得个人对自己利益的追求会导致对A和B都不利的结果,两个囚徒都会坦白,从而每个人都达到一个双方都认为是差于双方都不坦白的结果。
事实上,检察官所构造的这个困境对A和B的激励是如此的强烈,以至于很容易想象A和B被迫承认抢劫银行,甚至即使他们是清白的。
我国“文革”中坦白从宽、抗拒从严的政策之所以能使一大批人承认自己的“罪行”,其奥妙即在于此。
个人理性与集体理性的冲突。
囚徒困境反映了一个很深刻的问题,这就是个人理性和集体理性的冲突,即理性人的个人理性行为可能导致集体非理性。
很显然,A和B双方都抵赖(各判2年)比双方都坦白(各判5年)要好,但是,作为理性人的A和B都想占对方的便宜,结果谁也没占到。
囚徒困境背后的经济学原理

囚徒困境背后的经济学原理囚徒困境是博弈论中重要的经典问题。
在这个问题中,两名罪犯被警方逮捕,但警方缺乏证据,因此只能依靠两人的口供来定罪。
由于两人之间的不信任和互相指责,如果两人都坦率地承认自己的罪行,他们将会被判处重刑。
如果两人都保持沉默,他们只能被判处轻罪。
如果一个人坦白,而另一个人坚持沉默,则坦白者可以获得从轻发落的待遇,而沉默者则可能会被判处重刑。
这种情况下,每个人最优的选择应该是沉默,因为这是不论其它人如何选择,对自己来说最优的选择。
博弈论的解说明了这种情况下的悖论:每个人都会选择坦白,因为坦白可以提供更好的结果,但最后的结果对每个人来说却是最糟糕的。
这个例子揭示了一些重要的经济学原理和决策理论的思想:1. 不合作的博弈可能会导致不太理想的结果。
由于沉默是一个合作的选择,缺乏协调和互信可能会导致不合作。
在这种情况下,没有一种策略能够保证结果最好,因为每个人的最优策略都取决于对方的策略选择。
3. 因果关系可能是相反的。
在囚徒困境中,每个人的最优策略都是坦白,但这个选择却导致了最糟糕的结果。
结果并不是因为这个选择本身是糟糕的,而是因为两个人的选择相互影响。
这个例子表明,博弈论分析中因果关系可能是相反的。
4. 某些限制可能有助于改善结果。
在囚徒困境中,不全面的逮捕和刑罚规则可能导致最糟糕的结果。
如果警方有足够的证据来确认每个人的罪犯身份,或者刑罚规则可以鼓励合作,可能会有更好的结果。
囚徒困境背后的经济学原理指出了协调和信任在决策过程中的重要性,同时也强调了不同策略的影响和结果可能出现的悖论。
在现实生活中,这些原则对于政治、商业和经济决策的制定都有重要的指导意义。
如何解决囚徒困境?通过政策制定:囚徒困境中最优的结果是两个人都沉默,因为这可以降低整体刑罚程度。
当两个人不能沟通的情况下,这种结果很难得到。
相应的,制定政策可以引导人们采取更合作的选择,以奖励为中心的刑罚制度可以促进合作和信任。
共同合作的文化可以通过教育和社区监管来建立,并创造更利于信任的环境。
浅析生活中的囚徒困境

浅析生活中的囚徒困境浅析生活中的囚徒困境电信学院15211082杨哲一.囚徒困境的基本概念“囚徒困境”是1950年美国兰德公司的梅里尔·弗勒德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问艾伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。
两个共谋犯罪的人被关入监狱,不能互相沟通情况。
如果两个人都不揭发对方,则由于证据不确定,每个人都坐牢一年;若一人揭发,而另一人沉默,则揭发者因为立功而立即获释,沉默者因不合作而入狱十年;若互相揭发,则因证据确实,二者都判刑八年。
由于囚徒无法信任对方,因此倾向于互相揭发,而不是同守沉默。
最终导致纳什均衡仅落在非合作点上的博弈模型。
二.囚徒困境的意义囚徒困境指出市场是残酷的、无情的。
你不追求利润最大化,不追求效用最大化,你就难以存活下去。
同自然界“物竞天择”一样,从这个方面讲,人类社会似乎是一个“利”者生存的社会,没有利润,企业生存不了,工人存活不了。
所以,自利的原则还是存在的。
不可能使得最终所追求的利益最大化,但这并不是说人们不想最大化其利润,个体理性、个体利益最大,不一定能导致集体理性、集体利益最大,“囚徒困境”就是个人利益与集体利益相冲突的典型。
它揭示了非合作的自利行为可能导致两败俱伤的前景。
三.生活中囚徒困境博弈①公共设施修建的囚徒困境设想有两户相居为邻的农家(双方都是理性人),十分需要有一条好路从居住地通往公路。
修一条路的成本为4,每个农家从修好的好路上获得的好处为3。
如果两户居民共同出资联合修路,并平均分摊修路成本,则每户居民获得净的好处(支付)为3-4/2=1;当只有一户人家单独出资修路时,修路的居民获得的支付为3-4=-1(亏损),“搭便车”不出资但仍然可以使用修好的路的另一户人家获得支付3-0=3。
修路博弈的得利如下图所示:表1修路博弈我们看到,对甲和乙两家居民来说,“修路”都是劣战略,因而他们都不会出资修路。
囚徒困境PPTPPT课件

面对囚徒困境,我们需要勇于创新和变革,打破固有的思维模式和制度限制,寻找更好的解决方案。这有助于推动社会的进步和发展。
对未来发展的影响
THANKS FOR
WATCHING
感谢您的观看
社会制度应该鼓励和促进合作,减少囚徒困境的发生。例如,可以通过制定合理的法律法规、加强监管等手段,来引导个体在面对类似情境时做出更有利于社会的选择。
公平与效率
制度设计与监管
对社会制度的思考
全球化与合作
随着全球化的发展,各国之间的相互依存度越来越高,囚徒困境的启示有助于推动国际间的合作与交流,共同应对全球性的挑战。
囚徒困境
囚徒困境简介 囚徒困境的基本模型 囚徒困境的解决方案 囚徒困境的实际案例 囚徒困境的启示与思考
contents
目 录
01
囚徒困境简介
囚徒困境是一种博弈论模型,描述了两个犯罪嫌疑人被捕后,在不能互相沟通的情况下,各自选择最优策略时所面临的困境。
定义
囚徒困境源于现实生活中的囚犯困境问题,即两个同谋的囚犯在接受审判时,如果他们都保持沉默,则可能获得较轻的判决;但如果他们互相背叛,则可能获得较重的判决。
合作
在囚徒困境中,参与者可以通过选择合作的方式,共同达成更好的结果。合作可以避免被对方背叛的风险,同时也有助于建立长期的关系和互信。
长期视角
参与者应该从长远的角度考虑问题,认识到合作带来的长期利益,而不仅仅关注眼前的短期利益。通过建立长期关系和互信,可以降低囚徒困境中的风险和不确定性。
合作策略
有效沟通
沟通与信任
引入第三方监管机制,可以对囚徒困境中的参与者进行监督和约束,防止他们采取不合作或背叛的行为。监管机制可以提供公正的裁决和惩罚,维护游戏的公平性和规则的执行。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2. 友谊对基于回报的合作的产生并不是必要的:“在
合适的环境下,合作甚至可以在敌对者之间产生。”
3. 合作的基础不是真正的信任,而是关系的持续性。
从长远来看,双方建立稳定的合作模式的条件是否成 熟比双方是否相互信任来得重要。 4. 在适当的条件下,合作确实能够从没有集权的自私 自利的世界中产生。
(一)重复囚徒困境博弈的支付矩阵
策略i C(合作) D(背叛)
策略j C(合作) R=3,R=3 D(背叛) T=5,S=0 S=0,T=5 P=1,P=1
(二)第一届竞赛
策略j
策略i C(合作) D(背叛) C(合作) R=3,R=3 S=0,T=5 D(背叛) T=5,S=0 P=1,P=1
Oligopolistic Supergame”一文中指出,当发现对 方有不合作行为时,对对方的惩罚足够长、足够 大,并对实施处罚的人来说是最优的,即“严厉 可信惩罚战略”(the strongest credible
punishment)。
(二)合作与惩罚
• 6. 不确定性下的最优惩罚 • 在确定的情况下,惩罚越严厉,越有助于合作。
因为确定情况下,欺骗从来不会发生,所以惩罚
实际上是没有成本的。 • 但在不确定的情况下,即使每个人都选择合作, “坏结果”也会出现。如果坏结果总是触发惩罚, 就会冤枉好人,过重的惩罚反到导致不合作;但 如果总是原谅,合作也不会发生。这就有一个 “最优惩罚”的问题。
系安全带会导致事故概率提高吗?
• 例如:20世纪60年代美国立法强调要求司机系
(二)奥尔森的“集体行动的逻辑”
由具有自利倾向的理性“经济人
”组成的集体中,因“搭便车”
行为而难以实现合作:人人都想
分享集体行动的成果,但不愿分
担集体行动的成本。集体越大,
越难克服“搭便车”行为。
(二)奥尔森的“集体行动的逻辑”
“除非一个集团中人数很少,
或者除非存在强制或其他某些
特殊手段以使个人按照他们的
(三)第二届竞赛
策略j
策略i C(合作) D(背叛) C(合作) R=3,R=3 S=0,T=5 D(背叛) T=5,S=0 P=1,P=1
• 2. 结果
整体而言,“善良”的策略再次普遍表现得比“狡诈”的
策略好。前15名中只有一个不是“善良”的策略,最后15
名中只有一个不是“狡诈”策略。 其中,“一报还一报”策略再次获得第一名,并且获得了 基准分的96%;而“两怨换一报”的策略“死的很惨”。
谢谢聆听!
• 1. 过程
14个策略程序+1个随机程序(随机选择“合作”或“背叛 ”); 225场比赛,每个比赛200回合; 最大收益:15场×200回合×5分=15000分((D,C)或 (C,D)); 最小收益:15场×200回合×0分=0分((D,C)或(C ,D)); 基础收益:每场200回合全部选择(C,C),即双方合作 ,收益为600分;
(四)第三届竞赛
策略j
策略i C(合作) D(背叛) C(合作) R=3,R=3 S=0,T=5 D(背叛) T=5,S=0 P=1,P=1
• 1. 过程
原63个策略程序输入计算机迭代模拟,作为演化 博弈的第一代,在随机PK后根据每种策略产生的 “后代”数量来决定胜负。 经过1000代后,策略比例基本稳定。
囚 坦 白 -5, -5 徒 1 不坦白 -8, 0
囚徒1:坦白 囚徒2:坦白
0, -8 -1, -1
两个罪犯的支付矩阵
(三)囚徒困境的模型的意义
一般意义:
•
囚徒困境博弈既揭示了个体理性与集体理
性之间的矛盾——从个体利益出发的行为不 能实现团体的最大利益,同时也揭示了个体 理性本身的内在矛盾——从个体利益出发的
(二)合作与惩罚
• 4. 但是不是所有的惩罚都有效:①惩罚对方 的同时也惩罚了自己(触发策略);②实施 惩罚的条件不可信。 • 案例:惩罚不可信博弈
(二)合作与惩罚
• 5. 严厉可信惩罚战略
• 究竟什么样的惩罚最有利于鼓励人们合作?
• Abreu(1986)在“External Equilibria of
行为最终也不一定能真正实现个体的最大利
益,甚至会得到相当差的结果。
二、社会的基本问题
• 人类社会与其他动物群体的一个重要区别是,
人与人之间可以通过运用个人理性而达致某种
形式的合作。合作能产生“合作剩余”。
• 但是问题在于:在每个人都具有自利动机的情 况下,人们怎样才能通过社会博弈而自发产生 合作?换言之,社会合作能否从有着自己利益 最大化推理逻辑的个人的行为互动中自发产生 的?
(二)合作与惩罚
• 3. 重复博弈中惩罚的两种策略: • 针锋相对(tit-for-tat):每一次的行动都建 立在对手前一次行动的基础上。
(二)合作与惩罚
• 3. 重复博弈中惩罚的两种策略:
• 触发策略(trigger strategy)或冷酷策略:合作 中如果有任何一方采取一次背叛或不合作行为 ,其他博弈方就永远不与其合作。 • 以上两种都是对不合作行为的惩罚,根据博弈 论专家的社会实验,第一种方法有效性更高。
will),在公意存在的情况下,通过某种“社会契
约”,就可以达致并维持某种人类社会之间的某 种合作。
(一)西方古典社会契约理论
• 3. 西方古典社会契约理论的一个基本假设
一个具有共同利益的群体会在某种外在强制力量 和社会安排下为实现共同利益而采取集体行动, 并且这要么导致君主专制,要么达致共和独裁。 亦即,只有通过外部的强制力量才能确保自利的 个人实现社会合作。
没有利维坦(“作为国家政府的集权体制机构”
)的存在,人类合作将使不可能产生的,因此一
个强权的政府机构是必要的。
(一)西方古典社会契约理论
• 2. 卢梭的“社会契约论”
自由人之间的“公意”+“社会契约”→“公意
”的代表、社会契约的维护者(个人或组织)→
社会合作
自由人之间相互交往会产生“公意”(general
• “囚徒困境”模型是是博弈论中最经典、最著 名的模型,由普林斯顿大学数学系主任塔克( Tucker)1950年提出的; • 该博弈本身讲的是一个法律刑侦或犯罪学方面 的问题,但可以扩展到许多经济问题,以及各 种社会问题,可以揭示人类社会合作失败的重 要原因。
(二)囚徒困境的基本模型
囚徒 2 坦 白 不坦白
五、合作与激励和惩罚
(一)合作与激励
合作问题的实质
–个体理性与集体理性的矛盾
–个人行为与社会利益的冲突
如何把个人行为与社会利益统一起来,即实现合作?
• 激励(incentive)
• 物质手段(实施条件:掌握财富、信息、能力、公 正的第三方)
• 非物质的手段
(二)合作与惩罚
• 1. 在长期的重复博弈关系中人们之所以可能会实 现合作,是因为重视未来收益,不会为了短期利 益而做出有损未来收益的当前行为。换言之,对 未来的态度决定了当前的行为; • 2. 正因为此,如果在长期的重复博弈关系中有背 叛或不合作行为的出现,惩罚可能会成为实现合 作的有效手段;
(三)第二届竞赛
策略j
策略i C(合作) D(背叛) C(合作) R=3,R=3 S=0,T=5 D(背叛) T=5,S=0 P=1,P=1
• 1. 过程
62个策略程序+1个随机程序(随机选择“合作”或“背叛
”)
其中包括“一报还一报”策略,以及著名的生物学家、演 化博弈论的奠基人约翰•梅纳德•史密斯(John Maynard Smith)的“超级宽恕”程序——“两怨换一报”策略。
安全带的争议
(二)合作与惩罚
• 6. 不确定性下的最优惩罚
• 在现实社会中,当出现对方不合作行为时,人们会尽
量获得一些相关的信息,判断这种行为多大程度上是
故意的,多大程度上是客观环境造成的,然后再决定
是否惩罚以及多大的惩罚。 • 刑法上讲量刑必须适度,社会治理上讲“宽严结合”, 管理上讲“恩威并施”,其本质都是“最优惩罚”的 问题。
进一步阅读的材料
① 亚当〃斯密. 国民财富的性质和原因的研究(上下册), 商务印书馆,1974. ② 理查德〃道金斯. 自私的基因,中信出版集团股份有限公 司,2012. ③ 曼瑟尔〃奥尔森. 集体行动的逻辑,格致出版社,2011. ④ 霍布斯. 利维坦,商务印书馆,1985. ⑤ 卢梭. 社会契约论,商务印书馆,2011. ⑥ 阿克塞尔罗德. 合作的复杂性,上海人民出版社,2008. ⑦ 阿克塞尔罗德. 合作的进化,上海人民出版社,2007. ⑧ 谢识予. 经济博弈论,复旦大学出版社,2008. ⑨ 赫伯特〃金迪斯等. 走向统一的社会科学,上海世纪出版 集团,2005 ⑩ 赫伯特〃金迪斯. 理性的边界,格致出版社,2011
三、关于这一问题的重要思想
(一)西方古典社会契约理论
霍布斯(Thomas Hobbes)的“利维坦”理论
卢梭(Jean-Jacques Rousseau)的“社会契约论
”。
(一)西方古典社会契约理论
• 1. 霍布斯的“利维坦”理论
人类的自利与欲望→避免“自然状态”下的“所
有人对所有人的战争”→“利维坦”→社会合作
(四)第三届竞赛
策略j
策略i C(合作) D(背叛) C(合作) R=3,R=3 S=0,T=5 D(背叛) T=5,S=0 P=1,P=1
• 2. 结果
所有“狡诈型”策略都在200代左右完全消失。 “一报还一报”策略和另外5种“善良但不怯弱”
的策略获得了成功。
(五)三届竞赛的结论
1. 善良的策略总不首先背叛。
共同利益行事,有理性的,寻
求自我利益的个人不会采取行