蜈蚣博弈悖论的势分析

合集下载

实验经济学-蜈蚣博弈

1.实验指南蜈蚣博弈是罗森塞尔(Rosenthal，1981)提出的一个动态博弈问题。

由于博弈的扩展形式很像一条蜈蚣，因此被称为“蜈蚣博弈”。

实验表明，受到公平、信任、利他等因素的影响，人与人实际的博弈结果与理论的博弈均衡存在偏离。

蜈蚣博弈模型在公共政策领域有着极为广泛的应用，如区域政府间政策取向的博弈分析等。

实验包含若干轮，每轮包含若干阶段。

实验参与者每2人为一对，一人为角色A，一人为角色B。

参与者将两两配对进行，并交互先后进行决策。

参与者的收益将由双方的行为共同确定。

实验中，一方（A）首先根据当前阶段的收益进行决策，是继续进行还是终止本轮实验，若终止本轮实验，则将按照当前阶段收益为双方分配收益；若继续本轮实验，则进入到下一阶段，双方可获得的收益将发生变化，由另一方（B）进行决策，是继续进行还是终止本轮实验。

双方交替进行决策，直到有一方终止本轮实验，或者实验达到最大阶段数为止。

2.实验引导（1）指导语◇实验每2人为一对进行，一人为角色A，一人为角色B。

◇配对的两人在所有轮次中是否保持不变，取决于参数“匹配方式”的设置。

◇实验包含若干轮次，每个轮次包含若干阶段。

◇每个阶段中，A、B两人中将会有一人具备决策权。

决策时，参与者需要确定，是继续进入到下一阶段，还是在本阶段结束本轮实验。

AB轮流进行决策。

◇决策时，决策者可以看到若在本阶段结束，自己和对方能够获得的收益。

◇实验进行的总轮次、每轮次能够进行的最大阶段数，以及每个阶段A/B能够获得收益信息是否对参与者公开，取决于实验主持者对相关信息公布与否的设定。

（2）实验提示实验轮次:第I轮，共V1轮，角色:A/B本轮实验将在某一阶段结束，结束后双方获得的收益由收益表6.11确定。

表6.11 蜈蚣博弈的各阶段收益决策阶段 A收益（你）B收益（对方）继续/结束-> 1 2 0.5继续/结束-> 2 1 4继续/结束-> 3 6 1.5继续/结束-> 4 2 8继续/结束-> 5 10 2.5继续/结束-> 6 3 12继续/结束-> 7 14 3.5继续/结束-> 8 4 16继续/结束-> 9 18 4.5继续/结束-> 10 5 20说明：若总轮数实验主持者设定参数值为“不公布”，则V2显示为“*”；若总阶段数实验主持者设定为“不预知”，在当前阶段结束前，后续阶段中的数据均显示为“*”。

蜈蚣博弈

蜈蚣博弈蜈蚣博弈(Centipede game)什么是蜈蚣博弈蜈蚣博弈是由罗森塞尔(Rosenthal)提出的。

它是这样一个博弈：两个参与者A、B轮流进行策略选择，可供选择的策略有“合作”和“背叛”(“不合作”)两种。

假定A先选，然后是B，接着是A，如此交替进行。

A、B 之间的博弈次数为有限次，比如100次。

假定这个博弈各自的支付给定如下：1合作合作合作合作...合作合作A B A B …… A B （100，100）合作合作合作合作...合作背叛A B A B …… A B （98，101）现在的问题是：A、B是如何进行策略选择的？这个博弈因形状像一只蜈蚣，而被命名成“蜈蚣博弈”。

这个博弈的奇特之处是：当A决策时，他考虑博弈的最后一步即第100步；B在“合作”和“背叛”之间作出选择时，因“合作”给B带来100的收益，而“不合作”带来101的收益，根据理性人的假定，B会选择“背叛”。

但是，要经过第99步才到第100步，在99步，A考虑到B在100步时会选择“背叛”——此时A的收益是98，小于B合作时的100，那么在第99步时，他的最优策略是“背叛”——因为“背叛”的收益99大于“合作”的收益98……如此推论下去，最后的结论是：在第一步A将选择“不合作”，此时各自的收益为1，远远小于大家都采取“合作”策略时的收益：A：100，B：100-99。

1蜈蚣博弈的悖论1根据倒推法，结果是令人悲伤的。

从逻辑推理来看，倒推法是严密的，但结论是违反直觉的。

直觉告诉我们，一开始就采取不合作的策略获取的收益只能为1，而采取合作性策略有可能获取的收益为100。

当然，A一开始采取合作性策略的收益有可能为0，但1或者0与100相比实在是太小了。

直觉告诉我们采取合作策略是好的。

而从逻辑的角度看，一开始A应取不合作的策略。

我们不禁要问：是倒推法错了，还是直觉错了？这就是蜈蚣博弈的悖论。

什么是悖论？悖论(paradox)来源于希腊语，para意即“超越”，doxos的意思是“相信”。

蜈蚣博弈悖论-概述说明以及解释

蜈蚣博弈悖论-概述说明以及解释1.引言1.1 概述蜈蚣博弈悖论是一个有趣的概念，在博弈论和经济学领域引起了广泛的关注。

它揭示了在一些情况下，个体的理性选择可能会导致整体结果的恶化，从而违背了我们对于理性行为的常识理解。

蜈蚣博弈悖论的概念最早由约翰·内许·纳什提出，他是一位著名的博弈论学者，也是电影《美丽心灵》中的主角。

在蜈蚣博弈中，两个博弈者面对着一个简单的选择：继续合作还是背叛对方。

合作会带来一定的收益，但背叛会获得更大的收益。

然而，当双方都选择背叛时，他们获得的收益反而会比合作时更小，因为他们会陷入一个恶性循环，导致双方都无法取得最优结果。

这种现象的出现源于博弈过程中的信息不对称和不完全信息。

当一方选择背叛时，对方无法得知其真实意图，因此会做出相同的回应。

但如果双方都能够互相合作，他们将能够达到更优的结果。

然而，由于彼此之间的不信任，他们陷入了一个无法打破的困境。

蜈蚣博弈悖论的研究对我们理解社会行为和决策过程有着深远的意义。

它提醒我们，有时候人们的理性选择并不一定能够带来最好的结果，而可能导致整体的恶化。

在现实生活中，类似的悖论现象也存在于合作与竞争、公共利益与私人利益之间的权衡中。

了解蜈蚣博弈悖论可以帮助我们更好地理解人类行为，并寻找解决方案来避免潜在的困境。

接下来的文章将进一步探讨蜈蚣博弈悖论的影响因素、应用领域以及可能的解决方法。

我们将深入分析其中的数学模型和实证研究，以期对这一现象有一个更全面的认识。

通过增加对于合作与竞争的了解，我们可以在个人和社会层面上做出更明智的决策，从而实现真正的共赢局面。

1.2文章结构文章结构是指文章的组织框架和布局方式，它主要由引言、正文和结论三部分构成。

引言部分是文章的开头，用于引入主题并概述文章的内容和结构。

正文部分是文章的主体，包括详细而系统的论述和分析。

结论部分是文章的结束，总结主要观点并给出进一步展望。

在本篇文章中，引言部分将首先概述蜈蚣博弈悖论的基本情况和相关背景信息，引起读者的兴趣，并引出文章讨论的目的。

用“难得糊涂”来化解“蜈蚣博弈”的困境

用“难得糊涂”来化解“蜈蚣博弈”的困境摘要:本文首先对两个不同领域的概念进行了介绍,主要针对“蜈蚣博弈”由逆向归纳法引发的困惑进行了分析,指出在现实的博弈中,非理性人的“难得糊涂”在特定的情况下,能够达到个人和集体利益的最大化,是我们追寻的一种境界。

关键词:蜈蚣博弈逆向归纳法博弈难得糊涂理性人一、名词介绍1.“蜈蚣博弈”“蜈蚣博弈”(centipede game)是博弈论中的一个概念,它是由罗森塞尔(Rosenthal)在1981年提出的有限次动态博弈问题中的一个经典模型。

由于这个博弈的扩展式很像一条蜈蚣,因此被称为“蜈蚣博弈”。

蜈蚣博弈是指这样一个博弈:两个博弈方A、B轮流进行策略选择,可供选择的策略有“合作”和“不合作”两种。

博弈规则是:A、B轮流决策一次为一轮;在第n轮决策中,第一次若A选择“不合作”,决策结束,A、B的收益均为n;第二次若B选择“不合作”,决策结束,A得n-1,而B得n+2;下一轮则从A、B都得n+1开始。

假定A先选,然后是B,接着是A,如此交替进行。

假设A、B之间的博弈为一有限次,为99轮,共198个决策结,A、B双方各有99个决策结。

博弈树如下图所示: 在上图中,所有收益数组中第一个数字是博弈方A的收益,第二个数字是博弈方B的收益。

在这个博弈中的博弈方A、B是如何进行策略选择的?2.“难得糊涂”“难得糊涂”是清代书画家、文学家郑板桥题过几副著名的匾额中的一句名言,二百年来妇孺皆知,被世人当作人生信条,一直流传至今。

按照现代人的理解,“难得糊涂”,就是指一个人在非原则问题上不计较,在细小问题上不纠缠;对一些可问可不问的事情,可以装作未看见;以理智的“糊涂”,去平息可能发生的矛盾,排解心中的烦恼之事。

从某种意义上说,这样做往往可以解除许多心理压力,化干戈为玉帛,达到共创和谐的目的。

二、“蜈蚣博弈”的困惑1.逆推归纳法求解“蜈蚣博弈”“蜈蚣博弈”是一个有限完美信息的动态博弈,求解其子博弈精炼纳什均衡的最简便的方法是逆向归纳法。

蜈蚣博弈悖论 -回复

蜈蚣博弈悖论-回复什么是蜈蚣博弈悖论？蜈蚣博弈悖论是一种心理学和经济学的悖论，也被称为蜈蚣逆理论或蜈蚣效应。

该悖论的思想基于一个关于博弈理论的假设，假设蜈蚣每次步行时一侧的腿按照一定顺序向前移动，而剩下的腿则静止。

但经过简单的逻辑推理可以发现，从理论上来说，蜈蚣即使有无限多条腿，也无法前进。

在蜈蚣博弈悖论中，玩家的行动是连续而不是离散的，也就是说在某一时刻每个玩家可以进行的策略是连续的。

这样一来，每个玩家都面临一个困境，在他未来的策略和行为中，存在无穷多种选择。

然而，理性的假设下，玩家需要同时考虑到自己和对手的行为，即使存在无穷多的可能性。

遇到无穷多的可能性时，蜈蚣是否能做出一个选择来保证其前进的问题就成为一个普遍存在的难题。

根据传统的博弈理论，理性的玩家应该能够做出最佳选择，在某种程度上，这意味着玩家能够做出接近无穷次的选择。

然而，对于这个问题，蜈蚣却无法做出一个能够使其前进的选择。

蜈蚣博弈悖论揭示了人类对于连续决策的困扰以及理性决策的局限性。

在现实生活中，人们经常面临类似的问题，例如对于各种连续的投资机会的选择，或者是对于无穷可能性的考虑。

在解决蜈蚣博弈悖论时，需要考虑一系列因素，包括不确定性、个人风险偏好以及对即时收益和未来回报的权衡考虑。

另外，也需要了解到个体行为决策中的局限性，例如有限的认知能力和信息获取。

有人认为，蜈蚣博弈悖论说明了人类理性意识的有限性，因为理性决策并不是总能够解决所有问题。

根据蜈蚣博弈悖论，人们在面临连续决策时需要做出选择，然而，由于不确定性和局限性的存在，可能会导致最佳选择的失误。

然而，也有人持不同观点，认为蜈蚣博弈悖论可能只是一种思维陷阱，毕竟现实世界中并不存在真正的无穷连续。

这种观点认为，虽然连续性会给决策增加复杂性，但理性决策仍然是可能的，并且人类可以通过合理的模型和策略来处理连续的决策问题。

总而言之，蜈蚣博弈悖论是一个复杂而有趣的概念，引发了人们对于连续决策和理性行为的思考。

11蜈蚣博弈-从终点出发地思维

20
爱情博弈
• 小丽与小冬的故事
• 从逻辑看，倒推法没有问题，但结论违背直觉。
• 即使双方开始选择合作，合作也不会一直持续下去。
21
9
可以倒推的人生
• 1976年冬天，19岁的李恕权在休斯顿太空总署工作，同时在休斯顿大学主修电脑。业余时间全部放在音乐创作上 • 一位叫凡内芮的朋友在他事业起步时给了他最大的鼓励 • 一个星期六的早晨，凡内芮又热情的邀请李恕权到她家的牧场烤肉…… • 李恕权的梦想：五年后我希望能有一张唱片在市场上，而这张唱片很受欢迎，可以得到许多肯定。第二，我住在一个有很多很多音乐的地方，能天天与一些世界一流的乐师一起工作
• 有三个人要被关进监狱3年，监狱长同意满足他们每个人一个要求。美国人爱抽雪茄，要了三箱雪茄。法国人最浪漫，要一个美丽的女子相伴。而犹太人说，他要一部与外界沟通的电话……
14
• 决定命运的是选择，而非机会
• 如果只能活六个月，你会做哪些事情呢？会更多的做哪些事情？会和谁共同度过这六个月呢？ • 什么样的选择决定什么样的生活，你今天的生活是由三年前所做出的选择决定的；而今天的抉择，却将不仅决定你三年后，更会影响你最终离开人世时的样子。这就是人生博弈的法则
18
• 这人一路上越想越生气，于是等到敲开邻居家门后，他没说：请把你的父子借给我用一下。却张嘴说道：留着你的破斧子吧，我才不稀罕你的东西。 • 我们要思考的是：难道倒退法存在问题？
19
蜈蚣博弈的悖论
• 倒推法师分析完全且完美信息下的动态博弈的有用工具，也符合人们的直觉，但是在某种情况下却存在着无法解释的缺陷 • AB进行博弈，可供选择的策略是合作与不合作。规则是：AB两次决策为一组……

第八讲蜈蚣博弈

A —— B —— A ——…… A —— B —— A —— B —— (10,10) | * * * * | * * * | * * * * * * | * * * *| * * * * | * * * | (1,1) * (0,3) * (2,2) * * * (8,8) * (7,10) * (9,9) * (8,11)
A —— B —— A ——…… A —— B —— A —— B —— (10,10) | * * * * | * * * | * * * * * * | * * * *| * * * * | * * * | (1,1) * (0,3) * (2,2) * * * (8,8) * (7,10) * (9,9) * (8,11)
A —— B —— A ——…… A —— B —— A —— B —— (10,10) | * * * * | * * * | * * * * * * | * * * *| * * * * | * * * | (1,1) * (0,3) * (2,2) * * * (8,8) * (7,10) * (9,9) * (8,11)
感悟
• 这就是一个五年期限的倒后推理过程。实际上还可以延长或缩短时问跨度，但思路是一样的。 • 当你无所茫从的时候，一定要停下手来，静静地问一下自己：五年后你最希望得到什么？哪些事情能够帮助你达到目标？你现在所做的哪些事情有助于你达到这个目标吗？如果不能，你为什么要做？只有你能清清楚楚地回答这些问题时，休才能算是具备了学习人生博弈的最基本的条件。如果无法回答这些问题，那么就需要检讨一下自己想要成为什么样的人。 • 如果你没有清晰的目标，就会被诅咒一辈子，为那些有清晰目标的人工作，事实就是如此。当你在人才上奔波时，所追求的不是为了达成自己的目标，而是努力为了达成别人的目标，就是这么简单。

蜈蚣博弈学习.pptx

5
第6页/共20页
二、不要忘记目标
• 例如：上网查资料时，被网上其他内容所吸引，导致浪费时间。 • 在追求人生目标的过程中，我们有时会被途中的细枝末节和一些毫无意义的琐事分散了精力，扰乱了视线，
以致中途停顿下来，或是走上岔路，而放弃了自己原先追求的目标。这是很多人都会犯的错误，但是如果你已经意识到了，那么从现在开始，就要避免再犯同样的错误。
一、蜈蚣博弈悖论
• 蜈蚣博弈悖论 • 举例1： • 两个博弈方A、B轮流进行策略选择，可供选择的策略有“合作”和
“不合作”两种。规则是：A、B两次决策为一组，第一次若A决策结束，A、B都得n；第二次若B决策结束，A得n-1，而B得n+2； • 下一轮则从A、B都得n+1开始。假定A先选，然后是B，接着是A，如此交替进行下去，A、B之间的博弈次数为一有限次，比如100次。 • 现在的问题是：A、B是如何进、瞬间的选择决定人生
• 谁都在想自己的人生博弈中获得成功，那么你就要为这个目标而努力。每天花时间为自己修建成功的管道，享受人生博弈的终点，是每个人可以做到而且应该做到的事情。如果说出生的背景不公平的话，至少时间对每个人来说都是公平的，你都可以通过自己的努力争取胜利。当然，你除了花时间在某件事上以外，还需要动点脑筋，把精力用到关键点上。
12
第13页/共20页
五、瞬间的选择决定人生
• 漫长的人生，就像是一场蜈蚣博弈。所以每个人都要尽量往远处想，给自己多一些长远的计划和打算。如果你这样了，在这场博弈中，你的胜算就大一些。相反，只顾眼前利益，就会让自己未来的路变得狭窄起来。反过来也可以这么说，你现在的选择就决定了你未来的成败。
• 举例：两个和尚的眼光。
7
第8页/共20页

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

蜈蚣博弈悖论的势分析（西北农林科技大学理学院李红波）摘要：逆推归纳法是博弈论求解的重要方法，但是1981 年罗森塞尔提出的蜈蚣博弈给逆推归纳法带来了严重的挑战，研究发现，在蜈蚣博弈中，人们的选择和我们通过逆推归纳法求解得到的结果不同，形成了悖论。

通过对逆推归纳法的适用范围进行分析，我们发现我们在最初的理性人假设时我们忽略了人们在另一方面的理性——势理性，文章通过对势的概念、性质等进行分析研究，得到势理性的概念，并对通过势理性和有限理性的结合，解决了蜈蚣博弈悖论的问题。

关键词：蜈蚣博弈逆推归纳法博弈的势势理性一、引言：蜈蚣博弈是指这样一个博弈（如下图）:两个博弈方A、B 轮流进行策略选择,可供选择的策略有“合作”和“不合作”两种。

图一在上图中,所有得益数组中第一个数字是博弈方A 的得益,第二个数字是博弈方B 的得益。

利用逆推归纳法我们不难得到，在第一步A 将选择“不合作”,此时各自的收益为1 。

从逻辑推理来看,逆推归纳法是严密的,但结论是违反直觉的。

直觉告诉我们采取“合作”策略是好的。

而从逻辑的角度看,A 一开始应选择“不合作”的策略。

人们在博弈中的真实行动“偏离”了运用逆推归纳法关于博弈的理论预测,造成二者间的矛盾和不一致,这就是蜈蚣博弈的悖论。

蜈蚣博弈悖论给逆推归纳法提出里严重的挑战，这令许多博弈论学者感到困惑。

一些学者坚信逆推归纳法本身没有问题，是符合逻辑的，；也有一些学者则对逆推归纳法提出了质疑，否认了逆推归纳法的有效性；还有一些学者（如张峰）认为逆推归纳法悖论产生是源于逆推归纳法的适用范围问题，笔者同意最后一种观点。

文章通过对逆推归纳法的使用范围进行分析，认为逆推归纳法最大的问题就是对博弈方的理性人假设，首先，理性人的假设对博弈方的理性要求太高，这使得现实中很多人不满足逆推归纳法的假设，出现了求解错误的现象，其次，理性人假设中忽略了对理性人更深层次理性的考虑（文中成为势理性），由于理性人假设中缺少了势理性，使得逆推归纳法犯下以偏概全，只重眼前和近期利益而忽略长远利益的错误。

由于理性人假设的这两点致命的弱点，严格限制了逆推归纳法的适用范围和条件。

文章通过分析认为，像蜈蚣博弈这样比较多阶段的动态博弈不适合用逆推归纳法求解，只有当博弈进行到某一阶段后，剩余的子博弈满足逆推归纳法的假设条件时，才可以用逆推归纳法对该子博弈运用你退归纳法求解。

二、势的提出：“势”是中国传统战略思想的核心概念之一，但对其下一个明确的定义却非常的困难。

许多古代学者喜欢用比喻来谈“势”，如：李韩非认为，“夫有才而无势，虽贤不能制不肖。

故立尺材于高山之上，下临千仞之溪；材非长也，位高也。

桀为天子能制天下，非贤也，势重也。

尧为匹夫，不能正三家，非不肖也，位卑也。

千钧得船则浮，锱铢失船则沉，非千钧轻而锱铢重也，有势之于无势也。

”其实，“势”是指一种不以人的意志为转移的必然趋势，是事物发展的客观规律，也是事物存在的一种状态。

“势”具有隐蔽性、广泛性、动态性和较强的辐射力四个属性。

（1）“势”是无形的，具有隐蔽性的特点。

（2）“势”是广泛存在的，上至国家社会，下至企业个人，都有“势”的存在。

（3）“势”是不断变化的，是动态的。

随着时间的变化。

(4)以较强的辐射力实现系统功能的突现。

在棋盘上，强大的厚势常令对方望而却步。

在国际上，强国往往会给邻国造成巨大压力。

博弈中参与人的势：各种因素对参与人作用的合力，体现参与人对全局掌控的能力，它是由外部各因素共同作用并由参与人表现出来的一种状态。

势的作用：从整体而非局部把握事物的本质，以获得整体得益，我们可以通过对势的利用使得整体得益最大化。

三、势对理性人的分类：在理性人假设中，人是理性的，但这个所谓的理性中却缺乏了势的概念，忽略了理性人更深层次的理性，即势理性。

势理性是与势相依的理性，指具有整体观念和全局眼光的理性，是在适当的时候，会选择保全整体利益而放弃某以时刻的利益的理性。

下面我们以贝叶斯博弈中的一个例子来说明：有限次囚徒困境中，假设囚徒1有两种类型：理性和非理性，这是囚徒1的私人类型。

两种类型的概率分布为两人的共同知识。

P(理性)=1-p,P(非理性)=p ，囚徒2是理性的，理性的囚徒可以选择任何策略，而非理性的囚徒仅选择“针锋相对”策略，即第一阶段选合作，而在t>1阶段选择与对手在t-1阶段想同的行动。

支付矩阵为（设贴现因子1=δ）2,0,1<+<>b a b a 。

支付矩阵为：⎪⎪⎭⎫ ⎝⎛)0,0(),(),()1,1(b a a b C D CD现在我们对三次重复博弈进行探讨，当p(1+a)+(1-p)b>pa ，1+p+(1-p)b+pa>a ，1+p+(1-p)b+pa>a+b+pa 时，我们会看到博弈的结果为t=1 t=2 t=3 非理性囚徒1D D D 理性囚徒1D C C 囚徒2 D D C在博弈的第一阶段，理性的囚徒1并没有选择他的在这阶段的更优策略C ，而是选择了D，故意犯下错误，而误导囚徒2，这样可以使自己在整个博弈的过程中的得益最多，这说明理性的囚徒1具有势理性，这使得他的整体收益得到提高。

由此可见，人们在动态博弈中可能选取一个并非次步的最佳策略而体现故意犯错的行为为未来获得更多的利益做准备，于是，势理性是有利于人们得益最大化的，所以是理性的重要的一部分，我们将势理性加入的理性人假设中去，用势理性对理性人进行分类，这可以是博弈论有更广泛的应用范围，也可以使博弈分析得到更精确的结果。

我们通过势理性把理性人分为两类：1、局部理性人：没有势观念或势观念较弱的人，这种人缺乏全局观念，只看重眼前利益，看不到整体利益，就如在下棋中的不善弈者，只思谋子，而不思谋势。

2、整体理性人：有较强的势观念，这种人在博弈中可以从整体把握局势，有时会为了整体利益放弃当前的一些利益，就如在下棋中的善弈者，谋其势而非只谋其子，这种人可以实现自身整体利益的最大化。

当然这种人也分为两类：绝对整体理性人和相对整体理性人。

五、悖论势分析：在现实中, 人的理性必然是有限的。

但理性人假设在经济学的许多领域具有成功的应用, 原因一, 在于这些领域需要的理性程度不高, 一般人都能达到；原因二, 在于这些领域问题的解具有稳定性, 在理性人假设具有微小偏差的情况下也能很好的说明问题。

而逆推归纳法解娱蛤博弈恰恰不能满足上述两点。

娱蛤博弈由于博弈阶段复杂, 对博弈者的理性要求高, 面对娱蛤博弈, 普通人不能达到理性人的标准。

逆推归纳法得到的娱蛤博弈的子博弈完美纳什均衡具有不稳定性。

逆推归纳法忽略整体观，以偏概全，只注重眼前和近期利益，忽略长远利益等严重错误，通过给理性人与势的区分，可以让理性人实现真正的理性，弥补了这一缺陷。

由于蜈蚣博弈并不满足理性人假设，所以我们要重新思考理性人的假设，我们可以考虑参与人有势观念，我们称之为整体理性人。

在蜈蚣博弈中，我们假设所有参与人具有整体理性，都是整体理性人，并且这是共同知识，但由于理性的有限（在博弈中只能向前看30步），参与人并不能看清全部198步的博弈过程，所以，参与人会将注意力放在蜈蚣博弈开始的几步和结束的几步，如图一中所示，省略号的部分经常会被“忽略”掉，参与人A在第一步选择不合作的得益是1，而如果博弈可以进行到最后的话，参与人A的得益为100或98，这均远远大于1，所以具有整体理性的参与人A没有选择不合作的动机，同样参与人B也没有选择不合作的动机，这个过程会一直持续下去，直到参与人可以看清以后所有的博弈过程。

在此以后的博弈中，由于整个子博弈都可以被参与人所了解，成了完全完美信心的博弈，这时参与人从整体把握局势，为了获得更过的利益，相对整体理性人会考虑合作，但这种合作存在着风险，即为了得到更多的利益有可能损失已经得到的1个利益，所以，相对整体理性的人也会根据自己的风险偏好在适当的时候结束该博弈，这时如果加入风险的概念，参与人便近似满足了理性人的假设，这时我们就可以用逆推归纳法去求解蜈蚣博弈模型了；而绝对整体理性的人会为了追逐最终的100或101的利益而坚持与对方合作。

通过上面的分析，我们分几种情况讨论蜈蚣博弈的求解问题：1、参与人A或B为局部理性者，则由于局部理性者只顾及眼前和近期利益，所以博弈会比较早的结束，这种情况下，参与人满足理性人假设，所以可以用逆推归纳法求解，但现实生活中，局部理性人比较少，所以这种情况在试验中很少出现。

2、参与人中无局部理性者，参与人A或B为相对整体理性者，参与人A和B为有限理性者（在博弈中只能向前看30步），这种情况下，开始时，参与人的行为受到势理性的影响会一直选择合作，而当博弈进行到168步后，由于博弈变成了完全且完美信息博弈，所以相对整体理性者会根据自己的风险偏好加入风险损失值，然后再根据逆推归纳法解出自己的策略集合，在适当的时候结束该博弈。

在现实中这种情况会出现的比较多，因为大多数人都是相对整体理性人，他们有较强的势理性，也有较强的风险观念，他们会在适当的时候结束博弈，以实现自身利益最大化。

例如：我们假设A、B的风险损失系数（即他们认为出现损失的概率）如下：169步170步171步172步173步174步……A 0.42 0.45 0.49B 0.46 0.49 0.51用逆推归纳法，经计算我们得知，当A或B的风险损失系数大于0.5时，博弈就会停止，从上表中我们可以看出在174步时参与人B的风险损失系数为0.51，大于0.5，所以此时他不会选择合作，他会在此时结束博弈，这时二人的得益分别为86和89。

3、参与人A和B均为绝对整体理性者：这种情况下，双方都会一直合作下去，直到博弈结束，双方拿到100，100的完美结果，但在实现中这种类型的很少，所以这种情况一般不会出现。

参考文献张峰.逆推归纳法悖论探析[J].福建论坛.人文科学社会版.2004年第12期张峰.博弈逻辑中理性人假设的困境与思考[J].学术论坛.2007年第9期谢识予.经济博弈论[M].上海：复旦大学出版社.2010年2月，第三版易宪容，赵春明.行为金融学[M].北京：社会科学文献出版社.2004年8月Drew Fudenberg，David K.Levine.THE THEORY OF LEARNING IN GAMES[M].The MIT bridge,Massachusetts.London，English.1995。