博弈论与纳什平衡

合集下载

博弈论和纳什均衡

博弈论和纳什均衡博弈论是一门研究决策者在特定情境下进行策略选择的学科，它主要研究个体或团体之间的冲突与合作关系，并提供一种分析和解决这些问题的方法。

在博弈论中，纳什均衡是一个非常重要的概念，它被广泛应用于社会科学、经济学、政治学、生物学等领域。

一、博弈论的基本概念1. 博弈博弈是指在特定情境下，两个或多个决策者进行策略选择的过程。

每个决策者都有自己的目标和利益，他们通过选择不同的策略来达到自己的目标。

2. 策略策略是指在博弈中每个决策者可以采取的行动方案。

每个决策者根据自己的利益和目标选择最优的行动方案。

3. 支配策略支配策略是指在某种情况下，一个决策者采取某种行动方案时，其他所有决策者都会采取同样的行动方案。

这种情况下，该行动方案被称为支配策略。

4. 纳什均衡纳什均衡是指在博弈中，每个决策者都采取最优的策略，且没有任何一方可以通过改变自己的策略来获得更多的利益。

在纳什均衡下，每个决策者都做出了最优的选择，整个博弈过程达到了一个稳定状态。

二、纳什均衡的应用1. 社会科学在社会科学领域中，纳什均衡被广泛应用于研究人类行为和社会现象。

例如，在政治学中，研究政治家之间的竞争和合作关系时可以使用博弈论模型，并通过计算纳什均衡来预测政治家们可能采取的行动。

2. 经济学在经济学领域中，博弈论和纳什均衡被广泛应用于市场竞争分析、价格战、拍卖等问题。

例如，在拍卖中，参与者可以根据自己的信息和目标选择不同的出价策略。

通过计算纳什均衡，可以预测最终获胜者以及他所支付的价格。

3. 生物学在生物学领域中，博弈论和纳什均衡被用于研究动物之间的竞争和合作关系。

例如，在动物群体中，个体之间会存在资源的竞争和合作，通过使用博弈论模型并计算纳什均衡，可以预测不同类型的动物在不同情境下采取的行动。

三、纳什均衡的局限性虽然纳什均衡在博弈论中被广泛应用，并且在很多情况下能够提供准确的预测结果，但是它也存在一些局限性。

1. 纳什均衡不一定是唯一的在某些情况下，博弈模型可能存在多个纳什均衡。

博弈论和纳什均衡

博弈论和纳什均衡引言博弈论是一门研究决策制定者之间相互作用的学科。

纳什均衡是博弈论中的一个重要概念，表示在每个决策制定者根据自己的利益进行选择的情况下，不存在个体可以通过单独改变自己的策略来进一步获益的状态。

本文将介绍博弈论的基本概念和纳什均衡的理论，并探讨其在现实生活中的应用。

博弈论基本概念博弈论研究的对象是决策制定者之间的相互作用，其中包括两个或更多个决策制定者，每个决策制定者可以选择不同的策略。

博弈论的基本元素包括玩家、策略和收益。

玩家是决策制定者的角色，策略是玩家在每个决策点上可以采取的行动，收益是每个玩家在不同策略组合下所获得的利益。

博弈论中常见的博弈形式包括合作博弈和非合作博弈。

在合作博弈中，玩家之间可以进行合作并达成协议，而在非合作博弈中，玩家之间相互独立且没有协作的能力。

纳什均衡的概念纳什均衡是博弈论中的一个重要概念，由诺贝尔经济学奖得主约翰·纳什提出。

纳什均衡指的是在每个决策制定者根据自己的利益进行选择的情况下，不存在个体可以通过单独改变自己的策略来进一步获益的状态。

具体来说，在一个博弈中，如果每个玩家选择了一个策略组合，且任何一个玩家单独改变自己的策略都无法提高自己的收益，那么这个策略组合就是一个纳什均衡。

纳什均衡可以通过数学方法进行计算，其中最常用的方法是利用最优响应函数。

最优响应函数指的是一个玩家在其他玩家的策略给定时，可以最大化自己的收益的策略选择。

纳什均衡的特性纳什均衡具有以下几个重要的特性：1.独立于个体的理性决策：纳什均衡的形成不依赖于玩家之间的协商或合作，而是由每个玩家根据自己的利益进行独立的决策而达成的。

2.稳定性：在纳什均衡中，每个玩家都在最优响应下选择策略，没有动机或能力单独改变自己的策略来获得更好的结果。

这种稳定性使得纳什均衡成为一种理想的博弈状态。

3.不一定最优：纳什均衡并非一定是博弈的最优结果，即每个玩家获得的收益并不一定是最大化的。

纳什均衡是一种均衡状态，每个玩家在给定其他玩家的策略下无法获得更多的收益。

博弈论纳什均衡

博弈论纳什均衡什么是纳什均衡？1、纳什均衡（Nash equilibrium )，又称非合作博弈均衡，是博弈论概念，指的是：一种博弈稳定结果，谁单方改变策略，谁就会损失。

两个囚徒互相揭发，就是一种纳什均衡。

对于每个囚徒来说，如果打破纳什均衡，在对方实施揭发策略时，改变揭发策略，保持沉默，自己就会由判刑2年，变成判刑5年。

也就是说，两个囚徒互相揭发是稳定博弈结果，谁单方改变策略，就会受到损失。

这也就是均衡涵义所在，两个囚徒从利己角度，都不会单方改变策略。

博弈策略稳定，博弈结果也稳定。

之所以命名为纳什均衡，是因为提出者是经济学家、博弈论创始人约翰．纳什。

之所以称为非合作博弈均衡，原因就是：两个囚徒如果合作，互相保持沉默，各自只要坐牢1年；但最终博弈结果，也就是纳什均衡显著特征，是不合作。

2、纳什均衡意义重大。

纳什均衡提出，震动整个经济学界。

诺贝尔经济学奖得主萨缪尔森曾说：“你只要教会鹦鹉说‘需求和供给’，它也是经济学家。

”博弈论专家坎多瑞则说：“这只鹦鹉现在必须多学一个词了，那就是‘纳什均衡’。

”诺贝尔经济学奖得主迈尔森也说：“发现纳什均衡意义，可以和生命科学中发现DNA 双螺旋结构相媲美。

”纳什也因为提出纳什均衡，创立博弈论，而获得1994年诺贝尔经济学家奖。

纳值均衡意义重大，简单来说，就是它对于经济学具有重大意义。

读友们如果了解经济学看不见的手原理，就知道，古典经济学认为，通过市场这只‘看不见的手’调节，个体追求私利行为，会促进集体利益最大化。

但纳什均衡却违反上述原理：两个囚徒分别追求私利行为，并没有促进集体（囚徒整体）利益最大化，反而是损人不利己。

这正是市场失灵软肋之处，通过博弈论视角可以得到合乎逻辑解释，更有条件找到合适解决方案。

从上述这点，读友们可以“一斑窥全豹”，感受到博弈论重要性。

更重要的是，纳什均衡非常普遍，小至个人沟通，中到公司竞争，大到国家往来，都可以观察到。

Q2：怎样运用纳什均衡？1、分析囚徒困境。

博弈论中的纳什均衡

博弈论中的纳什均衡纳什均衡，Nash equilibrium ,又称为非合作博弈均衡，是博弈论的一个重要术语，以约翰·纳什命名。

约翰·纳什1948年作为年轻数学博士生进入普林斯顿大学。

其研究成果见于题为《非合作博弈》（1950）的博士论文。

该博士论文导致了《n人博弈中的均衡点》（1950）和题为《非合作博弈》（1951）两篇论文的发表。

纳什在上述论文中，介绍了合作博弈与非合作博弈的区别。

他对非合作博弈的最重要贡献是阐明了包含任意人数局中人和任意偏好的一种通用解概念，也就是不限于两人零和博弈。

该解概念后来被称为纳什均衡。

定义：纳什均衡(Nash Equilibrium)：在一策略组合中，所有的参与者面临这样一种情况，当其他人不改变策略时，他此时的策略是最好的。

也就是说，此时如果他改变策略他的支付将会降低。

在纳什均衡点上，每一个理性的参与者都不会有单独改变策略的冲动。

纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。

所谓“均衡偶”是在二人零和博弈中，当局中人A采取其最优策略a*,局中人B也采取其最优策略b*,如果局中人仍采取b*,而局中人A却采取另一种策略a，那么局中人A的支付不会超过他采取原来的策略a*的支付。

这一结果对局中人B亦是如此。

纳什均衡的经典范例就是囚徒博弈，但是研究博弈论常常会使人陷入一种只追求个人利益的误区，事实上我们应该明白所谓的博弈只是建立在参与者假定为古典经济学中的理性经纪人的条件下这只是一个假设，并不总能说明事实。

只是假定他们只是选择对自己最有利的策略，而不考虑社会福利或任何其他对手的利益。

也就是说，这种策略组合由所有局中人(也称当事人、参与者)的最佳策略组合构成。

没有人会主动改变自己的策略以便使自己获得更大利益。

“囚徒的两难选择”有着广泛而深刻的意义。

个人理性与集体理性的冲突，各人追求利己行为而导致的最终结局是一个“纳什均衡”，也是对所有人都不利的结局。

博弈论和纳什均衡

博弈论和纳什均衡关于博弈论和纳什均衡你应该知道这些美股腾讯财经[微博]2015-05-25 10:05我要分享139[摘要]纳什在与命运的博弈中找到均衡，纪念大师最好的方式就是尝试了解博弈论。

腾讯财经综合报道（风生）奥斯卡获奖电影《美丽心灵》主角原型、诺贝尔奖得主、美国数学家约翰-纳什日前与妻子在美国新泽西州乘搭的士时遇上车祸，两人均不幸遇难。

事发当时，这辆出租车失控撞向栏杆，两人均被抛出车外。

约翰-纳什因发表两篇关于非合作博弈论的重要论文，彻底改变了人们对竞争和市场的看法。

他证明了非合作博弈及其均衡解，并证明了均衡解的存在性，即著名的纳什均衡。

不均衡人生中孕育出均衡论纳什于1928年在美国西弗吉尼亚州出生，曾在麻省理工学院任教，晚年为普林斯顿大学担任数学系教授，死前与82岁妻子艾丽西亚在普林斯顿居住。

纳什以研究博弈论闻名，1994年获颁诺贝尔经济学奖。

他的理论被运用在市场经济、计算、演化生物学、人工智能、会计、政策和军事理论等多个领域。

纳什在数学领域上取得多项突破，但他同时深受精神分裂症困扰，其生平故事在2001年被改编成电影《美丽心灵》，赢得包括最佳电影在内的4项奥斯卡奖项。

尽管西维亚-纳萨斯（Sylvia Nasars）广为人知的小说《美丽心灵》（A Beautiful Mind）和改编自该书的、由拉塞尔-克罗（Russell Crowe）主演的同名奥斯卡电影探究了纳什错综复杂的生平，但都没有深入挖掘他的数学思想。

他的数学成果依然不被大众所熟知。

在当今科学界，人们普遍认为，与牛顿和爱因斯坦的数学理论相比，纳什的数学理论触及到的学科更多。

牛顿和爱因斯坦的数学旨在处理物理问题，而纳什的数学却可以应用在生物学和社会学领域。

如若不是精神疾病的困扰，纳什今天可能已与那些科学伟人齐名。

尽管如此，他在几个数学领域的重要贡献大家有目共睹。

他最大的成就来自于经济学方面。

由于他在博弈论上的开创性成就，他与约翰海萨尼（John Harsanyi）和莱茵哈德-泽尔腾（Reinhard Selten）一起获得了1994年诺贝尔经济学奖。

博弈论(潜在博弈、纳什均衡

博弈论(潜在博弈、纳什均衡潜在博弈和纳什均衡是博弈论中的重要概念。

潜在博弈是指在博弈开始之前，参与者对博弈规则和结果的假设和预期。

纳什均衡是指在博弈中，各参与者都采取最优策略时所达到的结果。

在现实生活中，我们经常会遇到各种潜在博弈的情况。

比如，在一个拍卖会上，卖家和买家都会根据对市场的了解和对对方行为的预期来制定自己的策略。

卖家希望以最高的价格卖出物品，而买家则希望以最低的价格购买物品。

他们的策略取决于对对方行为的预期，以及对市场供求关系的判断。

在这种情况下，纳什均衡的概念就显得尤为重要。

纳什均衡是指在博弈中，各参与者都选择了最优策略，没有人可以通过改变自己的策略来获得更好的结果。

换句话说，纳什均衡是一种稳定的状态，参与者不会主动改变自己的策略。

然而，纳什均衡并不一定是最优解。

在某些情况下，博弈参与者可能会因为缺乏信息或信任问题而无法达到纳什均衡。

在这种情况下，博弈参与者可能会采取非最优策略，导致整个博弈结果下降。

潜在博弈和纳什均衡的概念不仅适用于经济学领域，也可以应用于其他领域。

比如在政治上，各国之间的战略决策也可以看作是一种博弈。

每个国家都会根据对其他国家行为的预期来制定自己的策略，以达到自己的最大利益。

而纳什均衡的概念则可以帮助我们理解为什么有些国家会选择合作，而有些国家会选择对抗。

潜在博弈和纳什均衡是博弈论中的重要概念，可以帮助我们理解各种博弈情况下参与者的策略选择和结果。

在现实生活中，这些概念也可以应用于经济学、政治学等领域，帮助我们分析和解决各种复杂的决策问题。

通过理解和应用潜在博弈和纳什均衡的原理，我们可以更好地把握博弈中的机会和挑战，做出更明智的决策。

博弈论与纳什均衡——论理性人的婚姻法则

博弈论与纳什均衡——论理性人的婚姻法则博弈论与纳什均衡——论理性人的婚姻法则随着时代的变迁，人们对婚姻的期望也在发生变化，越来越多的人追求爱情、自由和平等的结合方式，婚姻关系也逐渐从传统的家族联姻转向基于个人选择和自主决策的结合方式。

然而，婚姻关系的稳定性和持久性仍然是婚姻学研究的热门话题。

博弈论被视为一种解决决策方案的数学方法，已经开始被应用于研究人类行为领域。

本文将探讨博弈论和纳什均衡在研究婚姻关系稳定性方面的应用，以及论理性人的婚姻法则。

提纲：I. 介绍A. 博弈论和纳什均衡基本概念B. 研究婚姻关系稳定性的必要性II. 博弈论应用于婚姻关系A. 纳什均衡和稳定性的关系B. 婚姻市场模型C. 基于博弈论的婚姻关系稳定性分析III. 纳什均衡和离婚率A. 离婚率和博弈论B. 纳什均衡和离婚率C. 博弈论分析离婚率的原因IV. 纳什均衡和婚姻满意度A. 婚姻满意度和博弈论B. 纳什均衡和婚姻满意度的关系C. 基于博弈论的婚姻满意度分析V. 论理性人的婚姻法则A. 博弈论和理性人决策B. 理性人的婚姻选择C. 理性人的婚姻关系维持VI. 基于博弈论的婚姻咨询A. 博弈论在婚姻咨询中的应用B. 婚姻咨询的目标和原则C. 基于博弈论的婚姻咨询案例分析VII. 未来展望A. 博弈论在研究婚姻问题中的局限性B. 婚姻关系研究的未来发展方向C. 博弈论在未来婚姻研究中的应用前景VIII. 结论A. 本文的主要贡献和局限性B. 未来研究的方向和建议C. 结论和总结I. 介绍本篇论文的第一部分主要是为读者引入本文的研究对象：博弈论和婚姻关系稳定性，并对这两个概念做基本的解释和说明，为接下来的探讨提供基础。

II. 博弈论应用于婚姻关系本文的第二部分主要集中在博弈论的应用方面，重点考察婚姻市场模型，探究基于博弈论的婚姻关系稳定性分析，以及纳什均衡和稳定性的关系。

III. 纳什均衡和离婚率本文第三部分主要集中在离婚率问题上，首先解释离婚率和博弈论的关系，然后重点探究纳什均衡和离婚率之间的关系，分析博弈论在理解离婚率的原因和趋势中的应用。

通过几个例子理解博弈论与纳什均衡

通过⼏个例⼦理解博弈论与纳什均衡2019/12/18更新，重新叙述⼀下智猪博弈2019/10/28更新，这⾥再举⼀个博弈论的经典例⼦，海盗分⾦问题。

喜欢玩德州扑克的⼈应该都听说过“GTO”这个词。

GTO，即 GameTheory Optimal，翻译成中⽂应该叫做“游戏理论最优化”。

直接翻译过来有点拗⼝，通俗⼀点的解释可以是：在游戏中，你可以采取⼀种最优策略，使得⾃⼰的损失最⼩，同时游戏中的对⼿也必须采取相对应的策略，否则只会扩⼤你的受益。

讲到GTO，就不得不提到博弈论中⾮常著名的⼀个理论：纳什均衡（Nash Equilibrium）。

该理论是由著名的经济学家，博弈论创始⼈，诺贝尔奖获得者约翰·纳什提出的，也就是电影《美丽⼼灵》的男主⾓原型。

该理论是说：在⾮合作类博弈中，存在⼀种策略组合，使得每个参与⼈的策略是对其他参与⼈策略的最优反应。

如果参与者当前选择的策略形成了“纳什均衡”，那么对于任何⼀位参与者来说，单⽅更改⾃⼰的策略不会带来任何好处。

约翰·纳什证明了在每个参与者都只有有限种策略选择，并允许混合策略的前提下，纳什均衡⼀定存在。

上边的解释还是有点拗⼝，这⾥通过⼏个例⼦，更直观的理解⼀下这个理论。

囚犯的困境假设有两个⼩偷A和B联⼿闯⼊民宅盗窃被抓，警⽅将两⼈置于不同的房间进⾏审讯，并给出如下政策：如果⼀个犯罪嫌疑⼈坦⽩并交出了赃物，两⼈都会被判有罪。

如果另⼀个犯罪嫌疑⼈也坦⽩，则两⼈各被判刑8年；如果另⼀个犯罪嫌⼈抵赖，再加刑2年，⽽坦⽩者有功，会被⽴即释放。

如果两⼈都抵赖，偷窃罪证据不⾜，但会因私⼊民宅⽽各判⼊狱1年。

即：表中的数字表⽰A，B各⾃的判刑结果。

博弈论分析中⼀般都⽤这样的表来表⽰。

此时有⼈会觉得双⽅都抵赖就好了，但问题是双⽅被隔离，都会怀疑对⽅会出卖⾃⼰以求⾃保。

两个⼈都会这么想：假如对⽅坦⽩，此时如果我抵赖得坐10年监狱，如果我坦⽩才坐8年监狱；假如对⽅抵赖，此时如果我也抵赖会被判1年，如果我坦⽩可以被释放。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

博弈论与纳什平衡博弈论（game theory）对人的基本假定是：人是理性的（rational，或者说自私的）,理性的人是指他在具体策略选择时的目的是使自己的利益最大化，博弈论研究的是理性的人之间如何进行策略选择的。

纳什（John Nash）编制的博弈论经典故事"囚徒的困境"，说明了非合作博弈及其均衡解的成立，故称"纳什平衡"。

所有的博弈问题都会遇到三个要素。

在囚徒的故事中，两个囚徒是当事人(players)又称参与者；当事人所做的选择策略(strategies)是承认了杀人事实，最后两个人均赢得(payoffs)了中间的宣判结果。

如果两个囚徒之中有一个承认杀人，另外一个抵赖，不承认杀人，那么承认者将会得到减刑处理，而抵赖者将会得到最严厉的死刑判决，在纳什故事中两个人都承认了犯罪事实，所以两个囚徒得到的是中间的结果。

类似的：我们也能从“自私的基因”等理论中看到“纳什平衡”的体现。

在互联网这个原始丛林中：最优策略是如何产生的呢？一、博弈中最优策略的产生艾克斯罗德（Robert Axelrod）在开始研究合作之前，设定了两个前提：一、每个人都是自私的；二、没有权威干预个人决策。

也就是说，个人可以完全按照自己利益最大化的企图进行决策。

在此前提下，合作要研究的问题是：第一、人为什么要合作；第二、人什么时候是合作的，什么时候又是不合作的；第三、如何使别人与你合作。

社会实践中有很多合作的问题。

比如国家之间的关税报复，对他国产品提高关税有利于保护本国的经济，但是国家之间互提关税，产品价格就提高了，丧失了竞争力，损害了国际贸易的互补优势。

在对策中，由于双方各自追求自己利益的最大化，导致了群体利益的损害。

对策论以著名的囚犯困境来描述这个问题。

A和B各表示一个人，他们的选择是完全无差异的。

选择C代表合作，选择D代表不合作。

如果AB都选择C合作，则两人各得3分；如果一方选C，一方选D，则选C的得零分，选D的得5分；如果AB都选D，双方各得1分。

显然，对群体来说最好的结果是双方都选C，各得3分，共得6分。

如果一方选C，一方选D，总体得5分。

如果两人都选D，总体得2分。

对策学界用这个矩阵来描述个体理性与群体理性的冲突：每个人在追求个体利益最大化时，就使群体利益受损，这就是囚徒困境。

在矩阵中，对于A来说，当对方选C，他选D得5分，选C只得3分；当对方选D，他选D得1分，选C得零分。

因此，无论对方选C或D，对A来说，选D都得分最多。

这是A单方面的优超策略。

而当两个优超策略相遇，即A，B都选D时，结果是各得1分。

这个结果在矩阵中并非最优。

困境就在于，每个人采取各自的优超策略时，得出的解是稳定的，但不是帕累托最优的，这个结果体现了个体理性与群体理性的矛盾。

在数学上，这个一次性决策的矩阵没有最优解。

如果博弈进行多次，只要对策者知道博弈次数，他们在最后一次肯定采取互相背叛的策略。

既然如此，前面的每一次也就没有合作的必要，因此，在次数已知的多次博弈中，对策者没有一次会合作。

如果博弈在多人间进行，而且次数未知，对策者就会意识到，当持续地采取合作并达成默契时，对策者就能持续地各得3分，但如果持续地不合作的话，每个人就永远得1分。

这样，合作的动机就显现出来。

多次对局下，未来的收益应比现在的收益多一个折现率W，W越大，表示未来的收益越重要。

在多人对策持续进行下去，且W比较大，即未来充分重要时，最优的策略是与别人采取的策略有关的。

假设某人的策略是，第一次合作，以后只要对方不合作一次，他就永不合作。

对这种对策者，当然合作下去是上策。

假如有的人不管对方采取什么策略，他总是合作，那么总是对他采取不合作的策略得分最多。

对于总是不合作的人，也只能采取不合作的策略。

艾克斯罗德做了一个实验，邀请多人来参加游戏，得分规则与前面的矩阵相同，什么时候结束游戏是未知的。

他要求每个参赛者把追求得分最多的策略写成计算机程序，然后用单循环赛的方式将参赛程序两两博弈，以找出什么样的策略得分最高。

第一轮游戏有14个程序参加，再加上艾克斯罗德自己的一个随机程序(即以50%的概率选取合作或不合作)，运转了300次。

结果得分最高的程序是加拿大学者罗伯布写的"一报还一报"(tit for tat)。

这个程序的特点是，第一次对局采用合作的策略，以后每一步都跟随对方上一步的策略，你上一次合作，我这一次就合作，你上一次不合作，我这一次就不合作。

艾克斯罗德还发现，得分排在前面的程序有三个特点：第一，从不首先背叛，即"善良的"；第二，对于对方的背叛行为一定要报复，不能总是合作，即" 可激怒的"；第三，不能人家一次背叛，你就没完没了的报复，以后人家只要改为合作，你也要合作，即"宽容性"。

为了进一步验证上述结论，艾氏决定邀请更多的人再做一次游戏，并把第一次的结果公开发表。

第二次征集到了62个程序，加上他自己的随机程序，又进行了一次竞赛。

结果，第一名的仍是"一报还一报"。

艾氏总结这次游戏的结论是：第一，"一报还一报"仍是最优策略。

第二，前面提到的三个特点仍然有效，因为63人中的前15名里，只有第8名的哈灵顿程序是"不善良的"，后15名中，只有1个总是合作的是"善良的"。

可激怒性和宽容性也得到了证明。

此外，好的策略还必须具有的一个特点是"清晰性"，能让对方在三、五步对局内辨识出来，太复杂的对策不见得好。

"一报还一报"就有很好的清晰性，让对方很快发现规律，从而不得不采取合作的态度。

二、合作的进行过程及规律"一报还一报"的策略在静态的群体中得到了很好的分数，那么，在一个动态的进化的群体中，这种合作者能否产生、发展、生存下去呢？群体是会向合作的方向进化，还是向不合作的方向进化？如果大家开始都不合作，能否在进化过程中产生合作？为了回答这些疑问，艾氏用生态学的原理来分析合作的进化过程。

假设对策者所组成的策略群体是一代一代进化下去的，进化的规则包括：一，试错。

人们在对待周围环境时，起初不知道该怎么做，于是就试试这个，试试那个，哪个结果好就照哪个去做。

第二，遗传。

一个人如果合作性好，他的后代的合作基因就多。

第三，学习。

比赛过程就是对策者相互学习的过程，"一报还一报"的策略好，有的人就愿意学。

按这样的思路，艾氏设计了一个实验，假设63个对策者中，谁在第一轮中的得分高，他在第二轮的群体中所占比例就越高，而且是他的得分的正函数。

这样，群体的结构就会在进化过程中改变，由此可以看出群体是向什么方向进化的。

实验结果很有趣。

"一报还一报"原来在群体中占1/63，经过1000代的进化，结构稳定下来时，它占了24%。

另外，有一些程序在进化过程中消失了。

其中有一个值得研究的程序，即原来前15名中唯一的那个"不善良的"哈灵顿程序，它的对策方案是，首先合作，当发现对方一直在合作，它就突然来个不合作，如果对方立刻报复它，它就恢复合作，如果对方仍然合作，它就继续背叛。

这个程序一开始发展很快，但等到除了"一报还一报"之外的其它程序开始消失时，它就开始下降了。

因此，以合作系数来测量，群体是越来越合作的。

进化实验揭示了一个哲理：一个策略的成功应该以对方的成功为基础。

"一报还一报"在两个人对策时，得分不可能超过对方，最多打个平手，但它的总分最高。

它赖以生存的基础是很牢固的，因为它让对方得到了高分。

哈灵顿程序就不是这样，它得到高分时，对方必然得到低分。

它的成功是建立在别人失败的基础上的，而失败者总是要被淘汰的，当失败者被淘汰之后，这个好占别人便宜的成功者也要被淘汰。

那么，在一个极端自私者所组成的不合作者的群体中，"一报还一报"能否生存呢？艾氏发现，在得分矩阵和未来的折现系数一定的情况下，可以算出，只要群体的5%或更多成员是"一报还一报"的，这些合作者就能生存，而且，只要他们的得分超过群体的总平均分，这个合作的群体就会越来越大，最后蔓延到整个群体。

反之，无论不合作者在一个合作者占多数的群体中有多大比例，不合作者都是不可能自下而上的。

这就说明，社会向合作进化的棘轮是不可逆转的，群体的合作性越来越大。

艾克斯罗德正是以这样一个鼓舞人心的结论，突破了"囚犯困境"的研究困境。

在研究中发现，合作的必要条件是：第一、关系要持续，一次性的或有限次的博弈中，对策者是没有合作动机的；第二、对对方的行为要做出回报，一个永远合作的对策者是不会有人跟他合作的。

那么，如何提高合作性呢？首先，要建立持久的关系，即使是爱情也需要建立婚姻契约以维持双方的合作。

（火车站的小贩为什么要骗人？为什么工作中要形成小组制度？换防的时候一方总是要小小地进攻一下的，在中越前线就是这样）第二、要增强识别对方行动的能力，如果不清楚对方是合作还是不合作，就没法回报他了。

第三、要维持声誉，说要报复就一定要做到，人家才知道你是不好欺负的，才不敢不与你合作。

第四、能够分步完成的对局不要一次完成，以维持长久关系，比如，贸易、谈判都要分步进行，以促使对方采取合作态度。

第五、不要嫉妒人家的成功，"一报还一报"正是这样的典范。

第六、不要首先背叛，以免担上罪魁祸首的道德压力。

第七、不仅对背叛要回报，对合作也要作出回报。

第八、不要耍小聪明，占人家便宜。

（打桥牌和打麻将的区别）艾克斯罗德在《合作的进化》一书结尾提出几个结论。

第一、友谊不是合作的必要条件，即使是敌人，只要满足了关系持续，互相回报的条件，也有可能合作。

比如，第一次世界大战期间，德英两军在战壕战中遇上了三个月的雨季，双方在这三个月中达成了默契，互相不攻击对方的粮车给养，到大反攻时再你死我活地打。

这个例子说明，友谊不是合作的前提。

第二、预见性也不是合作的前提，艾氏举出生物界低等动物、植物之间合作的例子来说明这一点。

但是，当有预见性的人类了解了合作的规律之后，合作进化的过程就会加快。

这时，预见性是有用的，学习也是有用的。

当游戏中考虑到随机干扰，即对策者由于误会而开始互相背叛的情形时，吴坚忠博士经研究发现，以修正的"一报还一报"，即以一定的概率不报复对方的背叛，和"悔过的一报还一报"，即以一定的概率主动停止背叛。

群体所有成员处理随机环境的能力越强，"悔过的一报还一报"效果越好，"宽大的一报还一报"效果越差。