(完整版)博弈论知识点总结

合集下载

博弈论(本科)

博弈论(本科)

博弈论第一节、基本概念1、定义:是描述和研究行为者之间策略相互依存和相互作用的决策理论。

2、基本类型:(1)静态与动态(2)完全信息与不完全信息3、基本要素:参与者;策略;支付矩阵;顺序;概率。

第二节、基本的博弈策略一、占优策略(静态、完全信息)无论其他参与者采取什么策略,某参与者唯一的最优策略。

注意:不论是同时选择,还是先后选择,均衡结果是相同的。

不常见。

二、纳什均衡:如果给定其他参与者的最优策略,某参与者的最优策略。

1、单一的纳什均衡(静态、完全信息)海滩定位博弈(动态、完全信息)2、两个纳什均衡(动态、完全信息)3、经典模型与应用智猪博弈:大股东与小股东;大户与散户;大企业与小企业等。

斗鸡博弈(两个纳什均衡):抢占市场;夫妻矛盾;两军对垒等。

三、最大最小策略:最大化最小所得的策略。

(静态、不完全信息)第一、保守,而非利润最大化。

第二、对对手的“完全理性”或“完全信息”缺乏信心。

第三、对手的错误选择将给自己造成严重后果。

案例:两厂商决策是否研发新产品,厂商1目前具有竞争优势。

(2)厂商1如何最大化预期收益:1无法确定2是否投资,但知道2不投资的可能性只有10%,1是否投资?投资的预期收益:0.1×(-100)+0.9×20 = 8不投资的预期收益:0.1×0+0.9×(-10)= -91应该投资。

如果1认为2不投资的可能性是30%,1是否投资?投资的预期收益:0.3×(-100)+0.7×20 = -16不投资的预期收益:0.3×0+0.7×(-10)= -71不应该投资。

四、混合策略(动态、不完全信息)纯策略:参与者有一确定的最优策略。

混合策略:不存在确定的最优策略,参与者根据各种结果出现的概率,以一定的概率随机选择各种策略。

零和博弈每个人都想猜透对方的策略,而又不想让对方猜透自己的策略。

只能统一对待。

流浪汉只有在政府不救济时才会找工作。

博弈论知识考点

博弈论知识考点

博弈是人们的行为之间的交互作用博弈论的含义博弈论是研究在策略性环境中如何进行策略性决策和采取策略性行动的科学。

策略性环境是指,每一个人进行的决策和采取的行动都会对其他人产生影响;策略性决策和策略性行动是指,每个人要根据其他人的可能反应来决定自己的决策和行动。

在所有社会,人们经常互动。

有时,互动是合作,其他的时候,互动是竞争。

在这两种情况下,都可以用一个术语,即相互依赖性来表示一个人的行为对另外一个人的福利造成的影响。

相互依赖的情形可称为策略环境。

因为人们为了确定所采取的最优行动,必须考虑他周围的其他人会怎样选择行动。

策略对于社会的运行来说,是非常基本的。

我们要学会了解在策略环境下,人们实际上是如何采取行动的,以及他们应该怎样采取行动。

这种系统的研究形成了策略互动的理论。

博弈论三要素:博弈的三个基本要素三个基本要素,即参与人、参与人的策略和参与人的支付。

所谓参与人(或称局中人),就是在博弈中进行决策的个体;所谓参与人的策略,指的是一项规则,根据该规则,参与人在博弈的每一时点上选择如何行动;所谓参与人的支付是指,在所有参与人都选择了各自的策略且博弈已经完成之后,参与人获得的效用(或期望效用)。

3.博弈的简单分类根据参与人的数量,可以分为二人博弈和多人博弈;根据参与人的支付情况,可分为零和博弈和非零和博弈;根据参与人拥有的策略的数量多少,可分为有限博弈和无限博弈;根据参与人在实施策略上是否有时间的先后,可分为同时博弈和序贯博弈。

一些概念:局中人或参与者(Players)规则(rules):规定博弈各方的行动顺序、方式、以及最终的结果等。

策略(Strategy):一整套的行动方案,规定了各种情况下的行动。

比如:敌进我退,敌退我追,敌驻我扰,敌疲我打。

相机策略(contingent strategy):仅在不确定事件发生时才会采取的策略。

如:人不犯我,我不犯人;人若犯我,我必犯人。

行动:局中人在特定条件下的行为支付( Pay-off ):博弈结束时,各方得到的收益。

博弈论的总结

博弈论的总结

博弈论的总结简介博弈论是研究决策制定和策略选择问题的数学模型和方法。

它通过建立数学模型,分析参与者的策略选择和决策结果之间的相互关系,从而预测可能发生的结果。

博弈论广泛应用于经济学、政治学、管理学等领域,对于理解人类行为和决策过程有重要意义。

基本概念1. 博弈博弈是指多个参与者根据一定规则进行决策的过程。

每个参与者都会考虑其他参与者的反应,从而选择自己的策略。

博弈的基本要素包括参与者、策略、收益和规则。

2. 参与者参与者是指博弈过程中的决策者,可以是个体或者集体。

3. 策略策略是参与者针对博弈过程中可能出现的各种情况所做的决策方案。

4. 收益在博弈中,每个参与者根据自己的策略选择和其他参与者的选择,获得相应的收益。

###5. 规则规则是指博弈过程中参与者必须遵守的行为准则和约束。

基本模型博弈论中有许多不同的模型,常见的有零和博弈、合作博弈和非合作博弈等。

1. 零和博弈零和博弈是指参与者的收益总和为零的一类博弈。

在零和博弈中,参与者之间存在一种竞争关系,一个参与者的收益的增加必将导致其他参与者收益的减少。

2. 合作博弈合作博弈是指参与者之间可以合作的一类博弈。

在合作博弈中,参与者可以通过协商、合作达成一致,来获得更高的收益。

3. 非合作博弈非合作博弈是指参与者之间不可合作的一类博弈。

在非合作博弈中,每个参与者根据自己的利益和目标,独立地选择策略,从而导致最终的结果。

博弈论的应用1. 经济学博弈论在经济学中有广泛的应用。

例如,在市场竞争中,企业之间选择定价策略、广告策略等都可以使用博弈论的模型进行分析和预测。

2. 政治学博弈论在政治学中也起到了重要的作用。

比如,选举制度的设计、国际关系中的谈判策略等问题都可以利用博弈论的模型来进行研究。

3. 管理学博弈论在管理学中的应用也非常丰富。

例如,企业中的合作与竞争、员工之间的博弈行为、资源分配等问题都可以使用博弈论的方法进行分析和决策。

总结博弈论是研究决策制定和策略选择问题的重要工具。

博弈论重点

博弈论重点

博弈论期末复习要点纳什均衡(P52):指的是参与人的这样一种策略组合,在该策略组合中,每个人的策略都是最优的,任何参与人单独改变策略都不会得到好处。

换句话说,如果在一个策略组合上,当所有其他人都不改变策略时,没有人会改变自己的策略。

完全信息(P34):各个博弈方都完全了解所有博弈方在各种情况下的得益状况。

上策均衡(P41):在某个博弈中,如果不管其他博弈方选择什么策略,一博弈方的某一个策略给他带来的收益始终高于其他策略,至少不低于其他策略。

帕累托上策均衡(P92):多个纳什均衡的某一个均衡策略给所有博弈方带来的得益都大于其他所有纳什均衡带来的得益,则各个博弈方都会倾向于此纳什均衡的策略,博弈能够实现帕累托效率。

聚点均衡(P97):在多重纳什均衡博弈中,双方同时会选择一个聚点构成的纳什均衡。

合并均衡(P268):具有完美信息的博弈方在博弈中,不管自己情况如何,都采取相同的市场均衡。

(在合并均衡中,完美信息博弈方的情况不同,并不会导致他们的行为不同,因此他们的行为不会给不完美信息的博弈方透露任何有用的消息)分开均衡(P268):在不同情况下,完美信息博弈方所采取完全不同的市场策略。

(在分开均衡中,由于博弈方的情况不同,采取的不同的市场策略,因此完美信息博弈方的策略可以完全反映他的情况,因此能够给不完美信息博弈方的“判断”提供充分的信息和依据)海萨尼转换(P292):将得益不了解转化为类型不了解的基础上,进一步将不完全信息静态博弈转化为完全但不完美信息动态博弈进行分析的思路。

完美信息(P34):动态博弈中在轮到行为时对博弈的进程完全了解的博弈。

不完美信息(P34):动态博弈中在轮到行为时对博弈的进程完全不了解的博弈。

混合策略(P72):博弈方以一定的概率分布在可选策略中随机选择的决策方式。

一致性预测(P53):如果所有博弈方都预测一个特定的博弈结果会出现,那么所有的博弈方都不会利用该预测或者这种预测能力,选择与预测结果不一致的策略。

《经济博弈论》重点(综合)

《经济博弈论》重点(综合)

纳什均衡:给定你的策略,我的策略是最好的策略;给定我的策略,你的策略也是最好的策略,即双方在给定的战略上不愿意改变自己的策略。

(局中人单独改变策略不会得到好处的对局策略组合。

)斯塔克伯格模型中,企业就可能具有先动优势。

(√)有限次重复博弈的子博弈完美纳什均衡中,最后一次重复必是原博弈的一个纳什均衡。

(√)在动态博弈中,均衡的结果取决于局中人威胁或承诺的可信性。

(√)零和博弈的无限次重复博弈中,所有阶段都不可能发生合作,局中人会一直重复原博弈的混合战略纳什均衡。

(√)(或:零和博弈的无限次重复博弈中,可能发生合作,局中人不一定会一直重复原博弈的混合战略纳什均衡。

(×))原博弈惟一的纳什均衡本身是帕雷托效率意义上最佳战略组合,符合各局中人最大利益,但惟一的纳什均衡不是效率最高的战略组合,存在潜在合作利益的囚徒困境博弈。

(√)(或:原博弈惟一的纳什均衡本身是帕雷托效率意义上最佳战略组合,符合各局中人最大利益,不存在潜在合作利益的囚徒困境博弈。

(×))根据参与人行动的先后顺序,博弈可以划分为静态博弈(static game)和动态博弈(dynamic game)。

(√)(根据博弈过程分为静态博弈、动态博弈和重复博弈三大类。

)均衡(equilibrium)是所有参与人的最优策略或行动的组合。

静态博弈指参与人同时选择行动或虽非同时但后行动者并不知道先行动者采取什么样的行动;动态博弈指参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。

上策:不管其它博弈方选择什么策略,一博弈方的某个策略给他带来的得益始终高于其它的策略,至少不低于其他策略的策略上策均衡:一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策,必然是该博弈比较稳定的结果阶段博弈重复博弈中的每次博弈称为“阶段博弈”。

1、无限次重复博弈与有限重复博弈的区别:a.无限次重复博弈没有结束重复的确定时间。

在有限次重复博弈中,存在最后一次重复正是破坏重复博弈中局中人利益和行为的相互制约关系,使重复博弈无法实现更高效率均衡的关键问题。

博弈论公式大全

博弈论公式大全

博弈论公式大全
博弈论中的公式和定理有很多,以下是一些常见和重要的博弈论公式:
1. 纳什均衡公式:对于任意的策略组合s1,s2,如果对于所有的i,pi(s1, s2) >= pi(si(1), s2) 和 pi(s1, s2) >= pi(s1, si(2))都成立,则称(s1, s2)为纳什均衡。

2. 零和博弈公式:在零和博弈中,一方的收益等于另一方的损失,即总和为零。

常见的零和博弈有剪刀石头布游戏、赌博等。

3. 优势策略均衡公式:如果对于任意的对手策略s2,玩家i的策略s1都是最优的,则称(s1, s2)为优势策略均衡。

4. 纯策略与混合策略公式:在博弈论中,玩家的策略可以分为纯策略和混合策略。

纯策略是指玩家在每个信息集上选择固定的行动,而混合策略则允许玩家以一定的概率在多个行动中进行选择。

5. 贝叶斯均衡公式:在非完全信息博弈中,如果每个玩家都采用贝叶斯纳什均衡策略,那么这个策略组合就是贝叶斯均衡。

6. 最大最小值定理:对于完全二叉树博弈,如果每个节点都有正的权重,那么最大最小值就是所有叶子节点的权重的最大最小值。

7. 尼姆定理:在非零和博弈中,如果每个玩家都追求自己的最大收益,则至少有一个玩家会获得零收益。

8. 约翰逊定理:在完全信息博弈中,如果存在一个玩家有严格优势策略,那么这个玩家将获得所有收益。

9. 拉姆齐定理:在非完全信息博弈中,如果每个玩家都采用最优混合策略,那么这个策略组合就是拉姆齐最优。

以上是一些常见的博弈论公式,它们在博弈论的研究和应用中发挥着重要的作用。

有关博弈人性的知识点总结

有关博弈人性的知识点总结

有关博弈人性的知识点总结有关博弈人性的知识点总结一、引言博弈理论是一门重要的社会科学,旨在研究人们在决策过程中所面临的竞争与合作情境。

博弈理论的核心在于研究人类行为中的策略选择以及相关的结果。

本文将对博弈理论中与人性相关的知识点进行总结,以期深入理解人们在博弈中的行为规律。

二、经典博弈理论模型1. 零和博弈与非零和博弈博弈可以分为零和博弈和非零和博弈。

在零和博弈中,参与者的利益完全互斥,一方的利益的增加会导致另一方的利益的减少,总收益为零。

而非零和博弈中,参与者的利益可以同时增加或减少,总收益不一定为零。

2. 合作与背叛博弈中的参与者面临合作与背叛的选择。

合作是指参与者通过共同合作实现最大化的收益,背叛则是指参与者个人行动,谋求最大化自身利益。

在经典的囚徒困境问题中,参与者面临合作与背叛的决策,合作的最优策略是互相信任,但单方面的背叛却可以获得更大的利益。

3. 策略与策略支配在博弈中,参与者需要选择自己的策略。

策略是指参与者在面对不同情境时的行动决策。

策略支配是指一个策略能够比其他策略在所有情况下都取得更好的效果。

三、心理学与博弈理论的关系1. 有限理性有限理性是指人类在决策时存在信息获取能力和认知限制。

在博弈中,人们的决策往往受到个人利益、情绪、认知偏差、时间压力等多种因素的影响,从而导致与理性决策相背离的行为。

2. 环境依赖性环境依赖性是指人类在决策时对环境的依赖。

人类的决策受到环境条件、他人行为以及情境因素的影响,而不仅仅是个体的利益或对策略的评估。

3. 合作与共享博弈理论的研究表明,人们在博弈中往往会选择合作与分享的策略。

合作与共享能够在困境中实现互惠互利,提高整体的社会效用。

四、博弈人性的案例分析1. 社会决策博弈社会决策博弈是指博弈参与者已知其他参与者的行动,并基于此进行决策。

在社会决策博弈中,人们往往会考虑其他人的行为,并根据其他人的选择来进行自己的行动。

2. 竞争与合作的关系博弈中的竞争与合作是相互交织的。

博弈论基础复习

博弈论基础复习

《博弈论基础》主要知识点一、名词解释(5×2=10分)策略型博弈它是由三个部分组成,即局中人、策略和各种策略组合中所得到的利益。

纳什均衡指参与博弈的每一局中人在给定其他局中人策略的条件下选择上策所构成的一种策略组合。

混合策略局中人的混合策略是其纯策略空间上的一种概率分布,表示局中人实际博弈时根据这种概率分布在纯策略中随机选择加以实施。

扩展型博弈博弈存在着局中人行动的先后次序,是对具有动态结构的决策形式进行研究的规范分析工具。

博弈树对于任何一种双人完备博弈,都可以用一个博弈树来描述,并通过博弈树搜索策略寻找最佳解。

博弈树类似于状态图和问题求解搜索中使用的搜索树。

完美信息博弈是指一次只有一个局中人在行动,而且他在行动时知道博弈的所有以往行动历史的一类特殊博弈。

子博弈指由原扩展型博弈中的一个决策节点与它的所有后续节点组成的博弈。

行为策略是指每一个参与人在每一个信息集上随机的选择行动。

逆向归纳法逆向归纳法是求解子博弈精炼纳什均衡的最简便方法。

在求解子博弈精炼纳什均衡时,从最后一个子博弈开始逆推上。

冷酷策略又称触发策略。

指参与人在开始时选择合作,在接下来的博弈中,如果对方合作则继续合作,而如果对方一旦背叛,则永远选择背叛,永不合作。

类型:一般地,将一个参与人所拥有的所有私人信息称为他的类型。

信号博弈是研究具有信息传递作用的信号机制的一般博弈模型,其基本特征是两个博弈方,分别称为信号发出方和信号接收方。

分离均衡信号博弈中的完美贝叶斯均衡之一,这种均衡中不同类型的发送者以概率1选择不同的信号,接收者完全可以通过信号来准确判断出发送者的类型。

混同均衡信号博弈中的完美贝叶斯均衡之一,这种均衡中不同类型的发送者选择了相同的信号,接收者无法从信号中得到新的信息,无法对先验信念进行修正。

特征函数特征函数型博弈对每一种可能联盟给出相应的联盟总和收益,也就是给出了一种集合函数,称为特征函数。

联盟二、选择题(5×2=10分)三、简答题(28-30分)1.博弈的分类及相关概念。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

博弈论知识总结博弈论概述:1、博弈论概念:博弈论:就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。

博弈论研究的假设:1、决策主体是理性的,最大化自己的收益。

2、完全理性是共同知识3、每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念与预期2、和博弈有关的变量:博弈参与人:博弈中选择行动以最大化自己受益的决策主体。

行动:参与人的决策选择战略:参与人的行动规则,即事件与决策主体行动之间的映射,也是参与人行动的规则。

信息:参与人在博弈中的知识,尤其是其他决策主体的战略、收益、类型(不完全信息)等的信息。

完全信息:每个参与人对其他参与人的支付函数有准确的了解;完美信息:在博弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动,否则为不完美信息。

不完全信息:参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信息,即存在着有关其他参与人的不确定性因素。

支付:决策主体在博弈中的收益。

在博弈中支付是所有决策主题所选择的行动的函数。

从经济学的角度讲,博弈是决策主体之间的相互作用,因此和传统个人决策存在着区别:3、博弈论与传统决策的区别:1、传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下,最大化自己效用,研究工具是无差异曲线。

可表示为:maxU(P,l),其中P为市场价格,丨为消费者可支配收入。

2、其他消费者对个人的综合影响表示为一个参数——市场价格,所以在市场价格既定下,消费者效用只依赖于自己的收入和偏好,不用考虑其他消费者的影响。

但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。

4、博弈的表示形式:战略式博弈和扩展式博弈战略式博弈:是博弈问题的一种规范性描述,有时亦称标准式博弈。

战略式博弈是一种假设每个参与人仅选择一次行动或战略,并且参与人同时进行选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。

1、参与人集合r={1,2,...,n}2、每位参与人非空的战略集S i3、每位参与人定义在战略组合H s=(SSS)上的效用函数Ui(s1,s2,...,sn).i1in扩展式博弈:是博弈问题的一种规范性描述。

与战略式博弈侧重博弈结果的描述相比,扩展式博弈更注重对参与人在博弈过程中遇到决策问题时序列结构的分析。

包含要素:1、r={1,2,...,n}参与人集合2、参与人的行动顺序,即每个参与人在何时行动;3、序列结构:每个参与人行动时面临的决策问题,包括参与人行动时可供选择的行动方案、所了解的信息;4、参与人的支付函数。

比较:1、战略式博弈从本质上来讲是一种静态模型。

精品word完整版-行业资料分享2、扩展式博弈从本质上来讲是一种动态模型。

5、博弈论分类:按决策主体的行为相互作用时,当事人能否达成一个具有约束力的协议可分为:1、合作博弈(强调团体理性、团体最优决策、效率)2、非合作博弈(强调个人理性,个人最优决策)按参与人行动先后顺序可分为:1、静态博弈:博弈中参与人同时行动,或者虽然不是同时行动,但是在行动前不知道其他参与人所选择的行动。

2、动态博弈:参与人的行动有先后顺序,后行动者获得先行动者的行动信息。

按参与人对信息的掌握程度可分为:1、完全信息:每个参与人对其他所有参与人的特征、战略空间及支付函数有精确的了解,博弈开始时不存在不确定性因素。

2、不完全信息:参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信息,即存在着有关其他参与人的不确定性因素。

按决策主体对信息的掌握程度和行动的先后顺序,博弈可以分为:完全信息静态博弈、完全信息二、四种博弈类型具体分述1、完全信息静态博弈1.1完全信息静态博弈特点:每个参与人对其他所有参与人的特征、战略空间及支付函数有精确的了解,博弈开始时不存在不确定性因素,参与人同时行动或者不是同时行动但是后行动者不知道行动者的行动信息。

战略和行动相同。

1.2完全信静态博弈相关概念:以新产品开发博弈举例说明:参与人:参与人1和2。

参与人的集合卡表示为:r={l,2,...n}•表示所有参与人的集合,在新产品开发博弈中为:r={l,2}行动:开发、不开发。

Ai表示参与人行动的集合。

新产品开发博弈中参与人的行动集合为A1=A2={a,b},其中a为开发,b 为不开发。

a={a1,a2...an}表示参与人的行动组合。

新产品开发博弈中为:A={(a,a),(a,b),(b,a),(b,b)}战略:参与人的行动规则。

在博弈中的战略可以定义为从观测集到行动集的映射关系,即:Si:Xi—Ai。

用Si={si}表示参与人所有战略的集合。

在n人博弈中,用S=(s17s2,s3.,s n)表示n个参与人的战略组合,它表示博弈中每个参与人采取战略si 的一种博弈情形。

精品word完整版-行业资料分享在完全信息静态博弈中,由于不存在决策时序上的差异,所有参与人在同一决策时点即博弈开始的那一时刻决策,因此,所有参与人面临的决策情形都只有一种,所以,参与人的战略集与行动集相同。

支付:是指参与人在博弈中的所得。

一般情况下也是用效用函数来表示参与人在博弈中的所得。

因此,参与人的支付就可表示为一种特定博弈情形下参与人得到的确定效用水平或期望效用水平。

支付一般用ui(1,2,...,n)表示参与人j的支付(效用水平),支付组合u=(u1,u2,...un)表示参与人在特定博弈情形下所得到的支付,其中为参与人/的支付。

因此,参与人i=(i=1,2,...,n)的支付就可表示为:ui=ui(s.$).i-i 信息:是参与人所具有的有关博弈的所有知识,如有关其它参与人行动或战略的知识、有关参与人支付的知识等等。

在“新产品开发博弈”中,如果两个企业都知道市场需求,那么这样的博弈情形就是我们前面所提到的完全信息假设;如果两个企业中至少有一个不知道市场需求,那么这样的博弈情形就是我们前面所提到的不完全信息假设。

1.3纯战略纳什均衡纯战略:参与人在给定信息下只选择一种特定(或确定性)的战略混合战略:混合战略解释了一个参与人对其他参与人所采取的行动的不确定性,它描述了参与人在给定信息下以某种概率分布随机地选择不同的行动或战略。

纯战略纳什均衡中包括:占有均衡、重复剔除劣战略均衡、一般纯战略纳什均衡等。

1、占优均衡占优战略:参与人的最优战略si*与其他参与人的选择s.无关。

无论其他参与人选择什么战略,参-i 与人的最优战略总是唯一的,这样的最优战略称之为“占优战略”。

在n人博弈中,如果对于所有的其他参与人的选择S.,si*都是参与人/的最优选择-iu(s*,s)>u(s,s)则称si*为参与人的占优战略「-111T在n人博弈中,如果对所有参与人都存在占优战略si*,则占优战略组合si*=(s1*si2*,...,sn*)称为占优战略均衡。

如果所有参与人都有占优战略存在,那么占优战略均衡就是唯一的所有理性参与人可以预测到的博弈结果。

2、重复剔除劣战略如果在一个博弈中,参与人不存在占优战略,但是参与人i存在两个战略,其中一u(s,s)>u(s,s)iiTiiiTi个战略叫另一个战略的所得效用要大,则理性的参与人绝对不会选择战略。

严格劣战略:u(s",s)>u(ss)iiTiiiTi弱劣战略:u(s",s)>u(s,s)若重复剔除过程一直可持续到只剩下唯一的战略组合,则该战略组合即为重复剔除的占优均衡,此时该博弈是重复剔除战略可解。

要点:再重复剔除过程中,如果每次剔除的是严格劣战略,均衡结果与剔除顺序无关;如果剔除的是弱劣战略,均衡结果可能与剔除顺序有关。

3、一般Nash均衡Nash均衡是完全信息静态博弈的解的概念,在完全信息静态博弈中,构成Nash均衡的战略是不可剔除的,即不存在任何一个战略严格优于Nash均衡战略。

求解纳什均衡的方法划线法、箭头法。

划线法:1、考察参与人1的最优战略2、用上述方法找出参与人2的最优战略3、找出最优战略组合箭头法:1、对于每个战略组合,检查是否有参与人会偏离这个战略组合2、直至找出没有参与人会偏离的战略组合精品word完整版-行业资料分享纯战略均衡反映函数:各博弈方选择的纯策略对其他博弈方纯策略的反应。

1.4混合战略纳什均衡混合战略:在博弈G二{r;SS;uu}中,对任一参与人i,设Si={S.i,…,S.k},则参与人i的一个混1n1n ii合战略为定义在战略集Si上的一个概率分布5i={8i i,…,8i k},其中5j(j=1,…,k)表示参与人i选i择战略表示参与人i选择战略S j的概率的概率,即8jii满足0W8W1,其中概率之和为1。

i支付:混合战略的支付为各种概率下收益的加权平均。

混合战略纳什均衡:在博弈G={r;SS;uu}中,混合战略组合8i二{81*,…,8n*}为一个Nash均衡。

当且仅当V i er,V Q1eZ,有v(G*Q*)>v°(GQ*)iiii-iii-i混合战略Nash均衡的求解:1.支付最大化法;2.支付等值法;混合战略均衡反映函数:在混合策略的范畴内,博弈方的决策是选择概率分布,因此,反应函数就是一方对另一方选择的概率分布的反应。

聚点均衡:在现实生活中,参与人可能使用某些被博弈模型抽象掉的信息来达到一个“聚点”均衡。

这些信息可能与社会文化习惯、参与人过去博弈的历史有关。

不同均衡概念之间的关系:占优均衡<重复剔除劣战略均衡<纯战略纳什均衡<混合战略纳什均衡1.5纳什均衡的多重性与存在性存在性:每个有限战略式博弈(参与人与相应的战略集均为有限)必存在纳什均衡,这个均衡可能是纯战略纳什均衡,也可能是混合战略纳什均衡。

多重性:一个博弈可能有多个均衡,博弈论并没有一个一般的理论证明,哪一个纳什均衡结果一定能出现。

2、完全信息动态博弈2.1完全信息动态博弈特点:在博弈开始之前参与人之间的信息不存在不确定性,但是参与人行动存在先后顺序。

在完全信息动态博弈中,为了表示参与人之间的信息掌握关系,引入了信息及的概念。

2.2完全信息动态博弈有关概念:信息集:信息集I.是参与人i决策结的一个集合,它满足以下两个条件:i1、I中的每个决策结都是参与人i的决策结;i2、当博弈到达I.时,参与人i知道自己处在该信息集中的某个决策结,但不知道是哪一个。

i在博弈树中,属于同一信息集的决策结一般用虚线连接起来。

结:包括决策结和终点结两类。

决策结是参与人采取行动的点时点,终点结是博弈行动路径的终点。

一个信息集可能只包含一个决策结,也可能包含多个决策结。

如果只包含一个决策结的信息集就是但单结信息集。

如果博弈中所有信息集都是单结的则成为完美信息博弈。

相关文档
最新文档