进化博弈论读书心得

合集下载

2024年读博弈论心得体会

2024年读博弈论心得体会

2024年读博弈论心得体会____年读博弈论心得体会:____字引言:博弈论是一门研究决策与互动的学科,它旨在解决个体在面对竞争与合作时所面临的问题。

作为一名博弈论的研究者,我在____年选择攻读博士学位,并对博弈论有了更为深入的掌握。

在这____字的心得体会中,我将分享我在研究博弈论过程中所获得的知识、经验和体会。

一、博弈论的基础知识博弈论的基础知识是我在研究中所学到的重要部分。

首先,博弈的元素包括玩家、策略和支付。

研究博弈时需要准确地定义这些元素,并使用数学模型进行分析。

其次,博弈论中的一些经典模型,如囚徒困境和霍金斯模型,都能够帮助我们理解人类行为和社会互动的复杂性。

此外,博弈论还涉及到博弈形式的分类,如合作博弈和非合作博弈,这些分类有助于我们深入探索不同类型博弈的性质和解决方法。

二、博弈论的应用领域博弈论的应用领域广泛,涵盖了经济学、政治学、生物学、计算机科学和社会学等多个学科。

在我的研究中,我发现博弈论在市场竞争、合作与协商、决策制定和政策设计等方面都有重要作用。

举个例子,研究者可以运用博弈论的理论和模型来分析市场竞争中的策略选择和收益。

此外,博弈论还可以帮助我们理解国际贸易、环境保护和社会公平等问题。

因此,博弈论的研究不仅可以提供理论指导,还可以为实际问题的解决提供实用工具。

三、博弈论的数学工具博弈论的研究需要使用到严谨的数学工具和方法。

研究者需要熟悉不同类型的博弈模型,并能够运用数学分析来得出结论。

在我的研究中,我学习了博弈论中的一些重要工具,如纳什均衡的概念和计算方法。

纳什均衡是博弈论中的一个重要概念,它描述了一种策略组合,在该组合下没有玩家有动机改变自己的策略。

计算纳什均衡是博弈论研究中的一项基本任务,我掌握了不同类型博弈模型的计算方法,并能够通过计算找到纳什均衡解。

四、博弈论的实证研究博弈论不仅仅是一门理论学科,它也具有实证研究的意义。

在我的研究中,我通过实验证明了博弈论的一些理论结果,并对实际问题进行了分析和解决。

博弈论学习心得(精品5篇)

博弈论学习心得(精品5篇)

博弈论学习心得(精品5篇)博弈论学习心得篇1博弈论学习心得学习博弈论的经历带给我许多深刻的见解和体验。

我将在此分享一些主要的思想,以及对博弈论的理解和应用。

1.背景介绍博弈论,起源于____冯·诺依曼和摩根斯坦于1944年合著的《博弈论与经济行为》。

博弈论,从学科分类来说,应该属于数学的范畴,但它又与经济学紧密相连,有时又被称为“应用数学”。

2.深入分析博弈论的主要思想是,参与者在面对一系列可能的决策和行动时,会考虑他们的选择以及可能的结果。

这与传统的经济学理论不同,后者主要关注于生产、分配和消费等宏观问题,而博弈论则聚焦于个体决策的过程。

3.个人观点对于博弈论,我认为它是理解和分析人类行为的一个强大的工具。

它使我们更好地理解,当面临多种选择时,人们是如何做出决策的。

例如,在谈判中,博弈论可以帮助我们理解对手可能采取的策略,以及我们如何应对。

4.对比与参照与传统的经济学相比,博弈论更关注于人类行为的不完美,以及在面对冲突和竞争时的选择。

这使得博弈论在解释和理解现实生活中的许多问题上,如囚徒困境、拍卖等,具有独特的优势。

5.创作风格在写作过程中,我尝试了一种清晰简洁的风格,以使读者能够理解和欣赏博弈论的理论框架。

我相信,通过清晰和深入的思考,我们可以更好地应用博弈论来解决现实生活中的问题。

6.结论和评分总的来说,学习博弈论让我对人类行为和决策有了更深的理解。

我认为,博弈论是一个非常有用的工具,可以帮助我们理解和解决现实生活中的冲突和问题。

我会继续学习和应用博弈论,以更好地理解和处理生活中的各种决策。

在*的写作过程中,我尽力遵循了准确、清晰和简洁的原则,希望能使读者更好地理解和欣赏博弈论。

博弈论学习心得篇2博弈论学习心得我之所以开始学习博弈论,主要是因为我对决策科学和策略游戏产生了浓厚的兴趣。

在这个过程中,我逐渐了解了博弈论的基本概念,如策略、纳什均衡、囚徒困境等。

随着学习的深入,我开始将这些理论应用到现实生活中,并从中获得了许多宝贵的经验。

博弈论心得体会范文(二篇)

博弈论心得体会范文(二篇)

博弈论心得体会范文博弈论是一门研究决策以及参与者之间相互影响的学科,也是现代经济学和社会科学中不可或缺的重要理论工具。

通过博弈论的学习,我深刻认识到个体和集体之间的博弈行为是社会交往中的普遍现象,在实际生活中博弈思维的运用能够帮助我更好地理解和应对各种冲突和合作场景。

首先,博弈论教会我从个体行为的角度看待社会问题。

在传统的经济理论中,个体行为往往被看作是理性决策的结果,忽略了环境和其他人的影响。

然而,博弈论则更加注重个体之间的相互影响和互动,认为个体的决策是受到其他人行为的影响而产生的。

这种视角的转变使我能够更全面地理解社会问题的本质,不再将其简单地归因于个体的理性选择,而是注重了相互之间的关系和相互作用。

例如,在考虑市场竞争时,不仅要考虑个体的价格和数量决策,还要考虑到其他竞争者的决策对自己的影响,从而更准确地预测市场行为。

其次,博弈论提醒我在决策过程中要考虑对手的反应。

在博弈中,每个参与者都会根据对手的策略做出自己的选择,因此在制定决策的时候,不仅要考虑个体自身的利益,还要考虑对手可能采取的行动。

这就要求我在决策过程中要有足够的信息收集和分析能力,以便预测对手的反应,并据此制定出最优的决策策略。

同时,博弈论也教会我要有灵活的思维方式,根据对手的策略进行及时调整和应对,从而增加自己的利益。

在现实生活中,博弈思维的运用可以帮助我在与他人交往和谈判时更好地把握主动权,更好地达到自己的目标。

此外,博弈论也让我认识到合作是实现最优结果的重要方式。

在博弈中,参与者可以选择合作以获得更大的利益,也可以选择竞争或者追求个体利益最大化。

通过博弈论的研究,我明白了合作的利益和竞争的利益往往是相互联系的,当个体之间建立起互信和互动时,可以实现合作最大化的结果。

这对于我个人来说,意味着在与他人合作时要主动沟通,理解对方的需求和利益,并寻找共同利益点,以达到双赢的结果。

而在面对竞争时,也要思考如何通过协调和合作来实现自身利益的最大化,而不是仅仅追求个人的竞争优势。

《博弈论》学习体会范文(2篇)

《博弈论》学习体会范文(2篇)

《博弈论》学习体会范文《博弈论》是一门研究决策制定的数学理论,主要应用于经济学、政治学和生物学等领域。

在学习过程中,我深刻认识到博弈论对于理解决策过程和预测结果的重要性。

同时,学习博弈论的过程也启发了我对于决策策略的思考和分析能力的提升。

以下是我对于学习博弈论的体会和经验总结:一、博弈论的基本概念和模型在学习博弈论的初期,我首先了解了博弈论的基本概念和模型。

博弈论主要研究的是参与者在决策过程中的相互影响和相互作用,通过建立各个参与者的决策模型和收益函数,探讨他们在不同策略下的最佳决策方式。

在初步了解了博弈论的基本概念后,我开始学习博弈论的基本模型,包括零和博弈、非零和博弈、合作博弈等。

零和博弈是博弈论中最基本的模型之一,也是最简单的博弈模型。

零和博弈是指参与者之间的利益完全相反,一个人的收益就是另一个人的损失。

通过学习零和博弈模型,我了解到了博弈中的关键概念,例如纳什均衡和最优反应策略等。

非零和博弈是指参与者之间的利益不一定完全相反,他们的利益可能存在一定的重叠部分。

学习非零和博弈模型,我了解到了通过合作和策略选择来实现最优利益的方法。

合作博弈是指参与者之间可以通过合作来获得更好的收益的博弈模型。

合作博弈着重研究参与者之间的合作和协调,通过建立合作博弈的分配规则来实现利益的最大化。

通过学习合作博弈模型,我了解到了通过合理分配和合作博弈的方式来实现参与者之间的共赢。

二、博弈论在实践中的应用在学习了博弈论的基本概念和模型之后,我开始了解博弈论在实践中的应用。

博弈论主要在经济学、政治学和生物学等领域有广泛的应用。

在经济学中,博弈论可以应用于竞争策略、定价策略和合作博弈等方面。

通过分析参与者的策略选择和收益函数,可以为企业制定更合理和更优化的决策策略,提高利润和市场竞争力。

在政治学领域,博弈论可以用于分析选举策略、决策制定和外交政策等方面。

通过分析不同参与者的策略选择和收益函数,可以预测选举结果、分析政策争论和推断外交决策。

2024年读博弈论心得体会(三篇)

2024年读博弈论心得体会(三篇)

2024年读博弈论心得体会博弈论是研究决策主体在相互直接作用情境下的决策过程及其均衡问题的学科。

该理论深入探讨了个体或集体在互动情境中的策略选择与结果。

经过一段时间的学习,对博弈论的基本概念和内涵有了初步的认识。

显然,对于一门深奥的学问,短时间内难以达到深入的理解。

实际上,生活处处显现着博弈的现象,只是有人未能察觉而已。

人生如同棋局,学会博弈是至关重要的。

虽然博弈并非万能,但缺乏博弈的生活是不完整的。

在社会交往中,共赢被视为一种理想的博弈模式。

双赢策略体现了高度的智慧,即在帮助他人的同时接受他人的帮助,从而使双方获得单打独斗无法实现的成果。

我们应当摒弃零和游戏的思维,拥抱双赢理念,追求“赢者不全赢,输者不全输”的平衡状态。

在人际对抗和较量中,成功往往取决于机会、体能和智能这三个基本因素。

不同的场合,这些因素的影响力各不相同。

例如,抛硬币游戏完全取决于运气,百米赛跑则主要依赖于体能,而篮球比赛和战争等对抗场合,智能则成为决定胜负的关键。

智能即策略和谋略的运用。

在多数对抗情境中,策略性地选择行动至关重要。

因此,博弈论作为一门研究互动情境下策略行为的学科,具有极高的实用价值。

人们在日常生活中不断与他人互动,无论是家庭、工作还是社会交往,都在进行着一场又一场的博弈。

生存的本能使人们在不知不觉中掌握了博弈技巧。

学习博弈论并非易事,因为它往往需要借助数学语言来表达。

尽管对有些人来说,数学的形式非常优美,但对大多数人而言,学习博弈论可能是一种艰难且痛苦的经历。

实际上,博弈论是一门极为有趣的学科,只要运用理性思维,就能发现其独特的魅力。

我们应当呼唤理性思维的回归,运用逻辑思维进行学习。

正确的学习方法会使博弈论变得引人入胜。

我们应该愉快地学习博弈论,因为其基础内容并不需要深厚的数学功底。

掌握这些基础知识,对我们的学习和工作都将产生积极影响。

博弈论大师鲁宾斯坦曾指出:“一个博弈模型是我们关于现实的观念的近似,而非现实的客观描述。

2024年重读博弈论的心得体会

2024年重读博弈论的心得体会

2024年重读博弈论的心得体会《博弈论》是一门研究决策制定和行为预测的学科,它的核心理念是通过建立模型来揭示个体和群体之间的互动关系,并基于这些模型进行决策与行动的分析和预测。

博弈论虽然诞生于数学领域,但其应用范围却极为广泛,涵盖了经济学、政治学、心理学等多个学科领域。

在经过深入研究和学习博弈论之后,我对其有以下几点心得体会。

首先,博弈论对于理解个体的行为和决策制定过程有着重要的作用。

博弈论认为个体在进行决策时,往往是在面临不确定性的环境中,并且自身的决策不仅仅会受到个体利益的影响,还会受到其他个体的决策影响。

因此,个体在进行决策时,需要考虑其他个体的决策对自己的影响,并在此基础上进行决策。

通过博弈论的研究,我深刻理解到了人们在实际生活中的决策行为并非单纯地基于个人的利益最大化,而是会考虑到其他个体的行为和利益。

其次,博弈论可以帮助解决冲突和合作问题。

冲突和合作是人们经常面临的情境,在这些情境中,个体之间存在着竞争和合作的关系。

博弈论提供了一种分析个体之间互动关系的方法,通过建立适当的模型,可以揭示不同决策对个体利益的影响,并帮助个体在冲突和合作中进行决策。

在学习博弈论的过程中,我发现博弈论不仅仅可以应用于经济领域,还可以应用于政治、社会等领域,为解决实际问题提供了新的思路和方法。

再次,博弈论强调策略的选择和优化。

在博弈论中,个体的决策并非是单纯地根据现实情境所做出的,而是需要根据对方的可能决策进行推测,并选择最优的策略。

这种策略选择和优化的思想在实际生活中也是有借鉴意义的。

通过博弈论的学习和理解,我认识到个体在决策时应该考虑到其他个体的可能行为,并在此基础上进行策略的选择和优化,以获得最大的利益。

最后,博弈论的研究对于个体的思维能力和分析能力有着很大的促进作用。

博弈论研究案例往往需要较强的逻辑推理和数学建模能力,通过分析和解决这些案例,能够提高个体的思维能力和分析能力。

在学习博弈论的过程中,我需要进行大量的思考和推理,不断地进行分析和建模,这对于我的思维能力和分析能力提升起到了很大的帮助。

2024年学习博弈论的心得体会范本(2篇)

2024年学习博弈论的心得体会范本(2篇)

2024年学习博弈论的心得体会范本我学过一段时间博弈论,一些思维过程中也可能自觉不自觉地使用一些博弈论思想,有两点比较突出的体会。

第一,制订政策或游戏规则,要保证所有人有参与积极性。

这纳什均衡概念,说起来当然简单。

但我自己觉得,以前所知道的这条道理—制订游戏规则要保证所有人有参与积极性—是简单接受,没有逻辑证明,或者,在直觉层次觉得这是对的,但没有认识到它____对。

有本书上说,以后的经济学家必须知道一个纳什均衡概念,否则不算经济学家,或者说,玩明白了纳什均衡,就像玩明白了价格一样,是经济学家的基本功。

我赞同。

协议必须是能够自动执行的。

第二,千万不能把别人当傻瓜。

这来自子博弈精炼纳什均衡。

合理的行为序列必然在每一步上都合理(当然,这里不去探讨历史理性),即使存在一点缺陷,也要从颤抖手均衡的思路来考虑问题,使自己不要随意使用触发策略,保证你好我好(也可以说是我好,他也好)。

如果把别人当傻瓜,吃亏的是自己,就像那个卖猫的故事。

把博弈论这种技术体系当作世界观,似乎有些危险,但其中的道理我必须重视。

以上是一点体会,希望能抛砖引玉。

博弈论学习感想与思考学习博弈论的目的,不仅是为了赢得更好的结局,也在于享受博弈分析的过程。

先给大家猜一个脑筋急转弯,问。

在什么情况下零大于二,二大于五,五又大于零。

答案是。

在玩石头.剪刀.布游戏的时候。

博弈,就是用这种游戏思维来突破看似无法改变的局面,解决现实的严肃问题的策略。

在博弈中,每个参与者都在特定条件下争取其最大利益,强者未必胜券在握,弱者也未必永无出头之日。

因为在博弈中,特别是多个参与者的博弈中,结果不仅取决于参与者的实力与策略,而且还取决于其他参与者的制约和策略。

也就是说在现实生活中____丝若要逆袭,学习并掌握必要的博弈论的知识是很有帮助和必要的。

事实上,博弈过程本来就不过是一种日常现象。

我们在日常生活中经常需要先分析他人的意愿从而做出合理的行为选择,而所谓博弈就是行为者在一定环境条件和规则下,选择一定的行为或策略,实施并取得相应结果的过程。

2024年博弈论学习感想和体会(3篇)

2024年博弈论学习感想和体会(3篇)

2024年博弈论学习感想和体会学习博弈论的意图,不仅限于获取更优的结果,还包括欣赏分析策略的过程。

在此,我想提出一个谜题来激发思考:在何种情况下,零超越二,二超越五,而五又超越零?答案即为在进行石头、剪刀、布游戏的时刻。

博弈论,运用这种游戏性思维,能帮助我们打破僵局,解决实际中的复杂问题。

在博弈中,每个参与者都力图在特定条件下最大化自身利益,强者的胜算并非必然,弱者也非永无翻身之日。

因为结果不仅由参与者的能力和策略决定,还受到其他参与者的影响和策略的制约。

因此,对于现实生活中想要逆袭的个体,掌握博弈论的原理是至关重要的。

实际上,博弈现象无处不在。

我们时常需要揣测他人的意图,以做出明智的决策,而博弈论就是研究在特定环境和规则下,人们如何选择策略并产生相应结果的过程。

比如,作为一名博士,当面临老板任务的压力和心仪对象的召唤时,运用博弈论的技巧可能会助你顺利度过难关。

置身于这样的三向选择中,处于弱势的你可能需要更多地依靠自我调整。

博弈论的应用范围广泛,它起源于数学运筹学的一个分支,涉及许多数学工具,这可能对初学者构成一定的障碍。

正如马克思所言,只有成功运用数学的科学,才能达到真正的完善。

因此,我们既要学习数学公式和理论,也要明白一个简单的道理:不精通数学的人同样可以成为生活中的策略大师,无需深厚的数学基础,我们也能通过学习博弈论来提升解决问题的能力。

孙膑未曾学习高等数学,但他运用策略帮助田忌赢得比赛的例子,就充分证明了这一点。

因此,我对课程中的数学公式和算法保持冷静态度,因为我深信只要把握住博弈论的核心,我将不会在学习中落败。

博弈论首先是一种理解现实世界的逻辑框架,其次才是将这种逻辑严密化为数学形式。

其价值在于创新的策略,而非解题方法。

我们学习博弈论的目标,既是为了赢得更佳的结果,也是为了享受分析策略的过程。

归根结底,博弈论是一个分析问题的工具,它的作用在于简化问题,使问题的分析变得清晰易懂。

因此,亲爱的博士们,为了生活中的逆袭,为了完成任务,为了赢得喜爱的人的欢心,让我们不仅要在课堂上深入学习,掌握这门课程,更要在日常生活中运用博弈论的思维,成为真正的策略大师。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
;
第II类博弈,二者支付都为正数。有两个对称的严格占优的纳什均衡,还有一个对称的混合策略纳什均衡,故它的解为 ,纳什均衡集合为
, 。
其中 。这一类博弈常见的例子如调和博弈。
第IV类博弈,二者的支付都为负数,没有严格占优的策略。它的解为 ,纳什均衡集合为
, 。
其中 。这一类常见的博弈如鹰鸽博弈( 的情形)。
(2) 的第二个特征是它存在统一的入侵屏障。即存在一个入侵屏障 使得对于任意的 有3-1成立。
(3) 的第三个特征是它是局部占优的,且如果该进化稳定策略是本定的标准
(1)中度稳定策略
称为一个中度稳定策略( ),如果对于任意一个 ,存在 使得对于任意的 都有下式成立:
3.进化稳定策略集 的结构
从3-1、3-3可知,一个进化稳定策略的支撑不可能包含另外一个进化稳定策略的支撑,更进一步说不可能包含对称的纳什均衡策略的支撑。例如:假设 ,存在 ,那么 ,因为 ,所以 ,所以 ,与 矛盾。因此有如下推论:
若 且 ,那么 。
另外,如果博弈的一个进化稳定策略是本质的(即完全混合策略),那么它是该博弈的唯一的进化稳定策略,而且在有限博弈中,支集是有限的,所以进化稳定策略也总是有限的,甚至可能为零。因此有下面的引理:
一个二人对称博弈 ,可假设有两个玩家的位置,每个位置上有相同的纯策略,而任意的策略的支付则依赖于玩家所选的位置,因此有如下的定义:
博弈 称为二人对称博弈,如果 , 且对于任意的 有 成立。
该对称博弈要求两个位置上的支付矩阵是互为转置的,即若 为第一人的支付矩阵, 为第二个人的支付矩阵,则 ,即

也即有若 ,则 。

集合 是有限的,且如果 ,那么 。
4. 与非合作博弈中的 、 等之间的关系
(1)从进化稳定策略的定义可以知道一个博弈的进化稳定策略必定是该博弈的纳什均衡,反之则不然,即 。
(2)劣策略肯定不会是进化稳定的,因为它本身不可能成为纳什均衡,弱劣策略也不会是进化稳定策略,就算它是纳什均衡集合中的元素,也不可能成为进化稳定的。例如若 且为弱劣策略,则存在 ,使得 ,与进化稳定策略的标准中的第二个矛盾,故若 是弱劣策略,则 。
若每一个个体都参与到竞争当中,则有
/
(1-1)
(1-2)
稳定的策略具有下列性质:整个种群中几乎所有的个体都采取了这个策略,且这些个体的
适应度必将高于竞争对手或者可能出现的突变异种的适应度,否则竞争对手或者产生的突变
异种会侵害整个种群,以致种群的削弱或者毁灭等,这时此策略便不可能是稳定的策略。若
是进化稳定策略,则 ,且 ,所以当 ,有
一、进化稳定策略最初的模型
进化博弈理论是将博弈论引入到生物学背景下产生的,当生物的特定表现型的适应度依赖于群体中的频率分布时,进化博弈论就是从这个角度来思考生物演化的问题的一种方法,古典博弈中,参与者根据自利的原则表现出理性行为,但在生物进化的背景下是不合适的,由此,理性原则被群体的动态性和稳定性取代,而自利原则则被达尔文的适应度所取代。在一些重要的假设下,将会得到博弈的一个新形式解:进化稳定策略。它是这样一个策略,如果整个群体的每个成员都采取这个策略,那么在自然选择的作用下,不存在一个具有突变特征的策略能够侵犯这个种群。
(1-6)
这是对称博弈策略集相同所决定的。二是对称博弈有更特殊的形式:双对称博弈。此时在其他条件满足下当且仅当 时称为双对称博弈。
例如:协调博弈就是一个很好的双对称博弈的例子。
>
三是对称博弈的纳什均衡的形式也有所不同,对称博弈具有不对称的纳什均衡,也具有对称的纳什均衡。策略组合 被称为对称博弈的纳什均衡,当且仅当 ,其中 ,这与通常的纳什均衡的定义是一致的,用 表示纳什均衡集合。当 时我们称该纳什均衡为对称的,此时纳什均衡可以表示为
(3)由上可知,若 ,则策略组合 是该博弈的纳什均衡,即 ,且是占优的纳什均衡,因此 是对纳什均衡的一种精炼,它是完美的纳什均衡即有如下的结论:若 ,则 。由此,可以知道: 。
(4)若 ,那么 是一个真平衡。
5. 的特征
(1)进化稳定策略的第一个特征便是“稳定”,它能保证该群体在遭遇其他物种入侵或者群体内发生突变个体时维持群体的稳定,从支付角度看就是进化稳定策略所能获得的支付优于其他的策略,从3-1可明显看出。
`
(3-2)
由此我们又回到了进化稳定策略的第一种定义的形式:
称 是该博弈的进化稳定策略,若满足如下两个条件:
(3-3)
当存在 满足 时有 。( 3-4)
这两个条件就如我们一开始所说的是判断一个策略是不是进化稳定策略的标准。
2.两种等价定义的作用
*
将上述(3-1)式在定义计数函数: 下可写为 ,且其等于
(1-7)
对称的情形下,它本质是一个策略空间,不同于往常的策略组合空间,当然,对称博弈的纳什均衡并非都要求是对称的,但也可以证明任意的对称博弈一定能够存在至少一个对称的纳什均衡,即对于任意的二人有限对称博弈, 。
例如:鹰-鸽博弈、石头-剪刀-布等博弈都是具有混合策略均衡的且是对称的。
以鹰鸽博弈为例:不是一般地,下面支付矩阵为一方甲的支付矩阵:
三、对称博弈下看进化稳定策略

1.进化稳定策略的定义
结论仍然集中二人对称博弈上, ,纯策略集为 ,混合策略集为 ,当 选择 而 选择 时,参与者 的支付矩阵为 ,则此时支付函数为 。
在对称博弈的下,进化稳定策略有两种等价的定义。由于对称博弈可以很好的解释单群体博弈,所以此时是在单群体情形下来讨论,假设有一个数量规模很大的群体,里面出现一组规模很小的突变者,他们选择的策略集是相同的且成对竞争,群体主体现在的策略为 ,这组小规模的突变者选择策略 ,并假设这组小规模突变族所占群体的份额为 。同时假设群体里每个代理人都参与竞争,每个代理人选择现任策略 的概率为 ,选择突变策略 的概率为 ,在此时的生物群体下的支付可以看作与其中一个代理人选择策略 时竞争产生的支付。那么相应的,代理人选择现任策略 的支付函数值为 ,同理有 。在这样的生物情形下,直觉告诉我们,群体要能抵抗外来的入侵或者应对突变者的袭击,那么现任策略 所能得到的支付必须高于入侵者或者突变者的策略 的支付。因此,进化稳定策略除了本文第一部分的定义形式外,有另外一种等价的定义形式:
很容易发现,当博弈是第I类或者是第IV类的时候,分别有 和 ,两个的支付一正一负,此时博弈都存在严格占优的策略,故都存在纯策略纳什均衡。
第I类的解为 ,纳什均衡集合为 和 。
第IV类的解为 ,纳什均衡集合为 和 。
当博弈是第II类或者第III类时,支付函数值同号,此时不仅仅存在对称的纯策略的纳什均衡,也存在对称的混合策略纳什均衡。
它与进化稳定策略相差仅在于前者只能是严格大于而后者可以取到等号成立。所以有第二种等价的方式定义,也是最初梅拉德·史密斯给出的定义形式.,只需将进化稳定策略中的第二个条件弱化即可, 。
综上,进化稳定策略和中度稳定策略都是博弈的纳什均衡的一种精炼,在群体博弈下也可以看成是对群体博弈纳什均衡的一种选择。
(1-3)
|
当 时有 (1-4)
满足上述条件(1-3)、(1-4)的策略就称为进化稳定策略,而上述的两个条件1-3、1-4也被认为是判别 的标准条件。
上述的策略是在纯策略情形下考虑的,当策略 是从一个可能策略集合中随机的选择而构成的,此时的策略称为混合策略。此时 若是一个混合进化稳定策略,假设 等是该群体的纯策略,赋予这些纯策略非零的概率值,那么 必须满足如下条件:
@
例如:囚徒困境情形就是一个非常好的对称博弈的例子。
上述是在纯策略下的情形,现在描述混合策略情形: ,用 表示策略集上的一个概率分布,即为该博弈的一个混合策略,用 表示其混合策略集,则混合策略组合空间为 ,此时任意的纯策略 在对手选择混合策略 时的支付为 。
2.对称博弈的特点
对称博弈是一种很特殊情形,它有自己的特征,一是对称博弈的最优回应对应 和通常的最优回应对应 不一样,通常的 是策略组合空间到策略组合空间之间的映射,而 是策略集到策略集之间的映射,即
最初的简化的模型由梅拉德·史密斯和普瑞斯给出,他和普瑞斯也给出了进化稳定策略的数学式的描述定义,这一模型的本质特征是假设该群体有无限大的规模,繁衍以无性生殖的方式进行,竞争只在两个不存在任何差异的对手间展开即是成对的竞争。生物学中价值是指两个动物为了争夺资源而增加的或者减少的达尔文适应度。故我们用适应度作为最后个体的收益的衡量,假想在这个无限的种群中,有两个策略 、 ,每一个成员都采取这两个策略之一,且策略的选择是随机的,在有竞争前个体的初始适应度为 ,再假设整个群体中选择 的概率为 , 、 分别表示选择相应策略带来的适应度,而 表示个体选择策略 而对手选择 时的收益,其他 等表示类同的意义。
由 是进化稳定的可知当 足够小且 时, ,由于函数 是双线性的,
可写为:
当 固定时,计数函数 是一个关于 的仿射函数,它的截距为 斜率为 ,如下图所示:
1
斜率为
|
1
条件(3-3)等价于截距是非负的,而条件(3-4)则等价于当截距为零时斜率是正值。因此当两个条件都满足时,则存在 使得对于所有的 都有 成立,因此 。对于进化稳定策略说明两个地方:一是并非所有的博弈都有进化稳定策略,有部分博弈是没有进化稳定策略的,例如石头--剪刀--布博弈就不具有进化稳定策略,不然随着时间的推移,就没有玩的意义了,因为玩家知道那个策略是对自己最好的。二是进化稳定性并不意味着群体平均支付是最优的。
进化博弈论读书报告
汪波
1973年,梅拉德·史密斯和普瑞斯将博弈论的思想引入到生物演化的分析中,二人提出了进化稳定策略(ESS),随着1978年,Taylor和Jonker发现了进化稳定策略和复制动力学之间的关系,标志着进化博弈理论的诞生,因为与复制动力学之间的关系,进化稳定策略也因此成为进化博弈理论最经典的概念。1982年,梅拉德·史密斯出版了《演化与博弈论》,该书揭示动物群体的行为变化的动力学机制,也因此书他被称为进化博弈论之父,1995年,Weibull著作了《EvolutionaryGameTheory》,2009年初,Sandholm 出版了《Population Game and Evolutionary Dynamics》专著,这篇读书报告是在看了这三本著作的很少的一部分内容之下,理解其中一些浅显的内容后完成的。
相关文档
最新文档