5 同时博弈与序贯博弈

第五章同时博弈与序贯博弈

目录

?5-1 正规型表示与展开型表示–树型表示转化为矩阵表示

–矩阵表示转化为树型表示:信息集?5-2 同时决策与序贯决策的混合博弈?5-3 树型博弈的子博弈

?5-4 子博弈精炼纳什均衡

?5-6 连续支付情形的序贯博弈

5-1 正规型表示与展开型表示?1.树型表示转化为矩阵表示

?“进入者”只有一个决策节点,他有两个纯策略可以选择:进入和不进入。

?“垄断者”有四个可能的纯策略:

–{容忍,容忍}、{对抗,对抗}、{对抗,容忍}、{容忍,对抗}。

?把首先行动的局中人放在行局中人的位置,后行动的局中人放在列局中人的位置。

?垄断者有不止一个纯策略可以导致相同的博弈结果。

?步骤:首先确定好可供每个局中人选择的纯策略的总数目,从而把表格的大小确定下来,然后在每个策略组合所对应的格子中,按照约定的规格填入相应的支付向量。

?2.矩阵表示转化为树型表示

?问题:树型如何能够表达出局中人同时进行博弈的情况。

信息集

?处理方法:用一个扁椭圆形的虚线的圈,把所论局中人的若干决策节点罩起来,成为他的一个信息集,并约定如下的理解:所论局中人只知道博弈是否进行到了他的这个信息集,但是在他知道博弈已经进行到他的这个信息集的情况下。他不知道博弈究竟进行到这个信息集中的哪个决策节点。

注意

?一个信息集罩住的必须首先是同一个局中人的决策节点。

?一个信息集罩住的必须是同一个局中人在同一个时点的决策节点。

?给予不被扁椭圆虚线罩住的每个决策节点以信息集的地位,是单点集的信息集。

?每一个决策位置都是一个信息集。

?在同一个信息集上,大自然、老天爷或者虚拟局中人必须给位于该信息集内的每个决策节点规定相同的行动选择集合。(数量,内容均相同)

?当博弈走到一个单点集的信息集时,面临决策的局中人对于博弈迄今的历史是清楚的,他清楚博弈具体走到了他的这个决策节点而不是别的决策节点。但是当博弈走到一个非单点集的信息集时,面临决策的局中人对于博弈迄今的历史是不清楚的,他不清楚博弃具体走到了他的这个信息集里面的哪个决策节点。

完美和不完美

?历史,也是一种信息。历史清楚的博弈,叫做完美信息的博弈,历史不清楚的博弈,叫做不完美信息的博弈。

?非单点集的信息集的作用,在于说明所论局中人在决策时面对不完美信息的局面,即他不能根据自己现有的信息对位于信息集内的决策节点进行区分,他不知道自己现在究竟位于这个信息集的哪个决策节点上。

定义

?定义:如果一个序贯博弈的每个信息集都是一个单点集,那么么该序贯博弈就是完美信息博弈。否则,它就是不完美信息博弈。

?同集同注

例子

?女方不清楚男方“先前做出”

的策略选择。女方必须要么

在两个决策节点上都选择足

球,要么在两个决策节点上

都选择芭蕾,她不能在一个

决策节点上选择足球,而在

另一个决策节点上选择芭蕾。

?女方的选择也可以放在博弈树的初始决策节点上,这时候男方的两个决策节点就位于同一个信息集内。此时,男方受到的限制是,他必须在位于信息集内的两个决策节点上作出相同的策略选择。

5-2 同时决策与序贯决策的混合博弈?混合博弈:包含同时决策行动和序贯决策行动的博弈。

例子

?假定有两家计算机公司,彼此就新产品的研发展开博弈竞争。博弈持续的时间为一年。

?在这一年里,这两家公司为能在市场上推出新产品而需要各自私下确定对研发的投入。

?假设两家公司致力推出的新产品类型相同,并且双方都知道对方要这样做,但他们都没有向公众公布他们的研发预算。

?了解对手研发投入决策的唯一方法,是通过在产业年度交易展上观察其产品的性能来推断最终产品的情况。

?在交易展上观察到对手的新产品后。双方必须分别对各自的新产品定价。

?假定公司的研发投入只有低预算和高预算两种选择。低预算的结果是新产品只是旧产品的部分改良,而高预算的结果则是推出一个完全不同于旧产品而且质量高很多的全新产品。低预算策略用“小”或者“小投人”表示,高预算策略用“大”或者“大投入”表示。

?假定方正和联想在看到对手的新产品后的唯一决策问题就是对自己的新产品进行定价,定价只有“高”和“低”两种选择。

?两阶段同时博弈的序贯结构

研发预算和定价博弈的矩阵型表述

浅析价格战中的博弈论

价格战中博弈论的浅析 2011-2012学年第一学期 课程名称:博弈论 班级:10物流治理(采购与供应链1班) 学号:1040407122 姓名:曾维乐

二〇一一年十二月十八日 价格战中的博弈论浅析 摘要:博弈论研究互动决策行为,大多数时候是研究对抗性行为,但并不是所有的对抗行为。博弈论是运筹学的一个重要分支,类型众多。本文在简要介绍了博弈论相关内容的基础上,重点介绍了纳什均衡。通过案例,充分运用囚徒困境、智猪博弈、反向归纳法等进行分析,从而得出在经济决策中行为人如何决定最优决策的方法。在此基础上,结合博弈论相关知识,分析解决经济生活中的一些实际问题。如:针对商家的价格战问题。

关键词:囚徒困境懦夫博弈安全博弈纳什均衡 一、理论介绍 1、博弈论简介 博弈论(game theory),也称对策论,它是运筹学的一个重要分支,是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题,简单讲来确实是一些个人或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自同意选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。 从上述定义中能够看出,一个完整的博弈一般由以下几个要素组成:博弈的参加者,各博弈方各自选择的全部策略或行为的集合、博弈方的得益(得益矩阵)、结果、均衡等。 1、参与人指的是博弈中选择行动以最大化自己效用的决策主体(能够是个人,也能够是团体)。 2、行动是指参与人在博弈进程中轮到自己选择时所作的某个具体决策。 3、策略是指参与人选择行动的规则,即在博弈进程中,什么情况下选择什么行动的预先安排。 4、信息指的是参与人在博弈中所明白的关于自己以及其他参与人的行动、策略及其得益函数等知识。 5、得益是参与人在博弈结束后从博弈中获得的效用,一般

第五章 博弈论

第五章 博弈论 占优策略无论对方选择什么策略,都能使自己的支付大于其他选择的策略,相对于占优策略,其他策略均为劣策略。 纳什均衡是一个博弈均衡解的概念。 1、纳什均衡作为一个最优策略组合,每个局中人的策略都是给定其他局中人的策略情况下的最佳反应; 2、该策略具有自我实施的功能,没有一个人有动力改变自己的策略。 混合策略的纳什均衡在两个局中人标准式博弈{}2121,;,u u s s G =中混合策略组合),(*2*1p p 是 纳什均衡的充要条件为,每一个参与人的混合策略是另一个参与人的混合策略的最优反应, 即),(),(*211*2*11P P V P P V ≥且),(),(2*12*2*12P P V P P V ≥。 子博弈精炼纳什均衡的定义扩展式博弈的最优战略组合S=(S1,SI,Sn),如果它是原博弈的纳什均衡,且是在每一个子博弈上给出的纳什均衡,则该最优战略组合是该扩展式博弈的一个子博弈精炼纳什均衡。 1. 论述海撒尼转换的思路与目的 在博弈中,信息不完全使得博弈参与人必须预测其他参与人的类型。至于“类型”概念,可以通过两个企业博弈的例子来加以说明。假设参与人1为在位者企业,参与人2为进入者企业。进入者依据在位者的生产成本高低选择是否进入该行业,高则进,低则不进。但是进入者不知道在位者的成本是高还是低。因此,进入者必须预测在位者的成本“类型”,究竟是高成本的还是低成本的。海萨尼提出通过引入“自然”概念解决这个问题。由自然实现行动,确定其他参与人的类型,从而转换成我们已讨论过的扩展式动态博弈结构。即通过自然选择类型,实现不完全信息向完全信息的转换,我们称之为海萨尼转换。 2、精炼内叶斯纳什均衡的求解原理 假定有n 个参与人,参与人i 的类型是i i Θ∈θ,i θ是私人信息,)(i i i p θθ-是属于类型i θ的参与人i 认为其他1-n 个参与人属于类型),,,,,(111n i i i θθθθθ +--=的先验概率。令i S 是参与人i 的战略空间,i i S s ∈是一个依赖于类型i θ的特定的战略。),,,,,(111h n h i h i h h i a a a a a +--=是在第h 个信息集i 观察到其他1-n 个参与人的行动组 合,它是战略组合),,,,,(111n i i i s s s s s +--=所规定的行动的一部分。)(~h i i i a p --θ是在 观察到h i a -的情况下,参与人i 认为其他1-n 个参与人属于类型 ),,,,,(111n i i i θθθθθ +--=的后验概率。 1()() ()()P{}Pr {}()() h k k h k k k h K h h j j j p a p p a p a ob a p a p θθθθθθθ=≡≡∑ i p ~是所有后验概率)(~h i i i a p --θ的集合,),,(i i i i s s u θ-表示参与人i 的效用函数。 于是,精炼贝叶斯均衡可以定义如下: 精炼贝叶斯均衡是一个战略组合))(,),(()(11n n s s s θθθ***= 和一个后验概率组合 )~,,~(~1n p p p =,满足: (P)对于所有参与人i ,在每一个信息集h , );,()(~m ax arg ),(i i i i h i i i s i i i s s u a p s s i i θθθθ----*∑-∈ (B))(~h i i i a p --θ是使用贝叶斯法则从先验概率)(i i i p θθ-,观测到的h i a -和最优战略 )(?*-i s 得到的。 3、比较经典均衡分析理论与博弈分析理论的异同

用博弈论分析生活中的现象

上海第二工业大学 2012-2013学年第二学期 用博弈论分析生活现象论文

博弈论分析生活中现象 博弈论它较好地解决了对竞争等问题的可操作性分析,成为经济学中激荡人心的一个研究领域,主要是研究各相关行为主体的决策行为相互影响、相互作用的假定条件下,博弈论就是分析博弈行为和博弈决策的一门科学。其实博弈现象不只现身于经济领域对于我们日常生活中也是处处可见的,所以博弈论的思想不仅仅能够用来分析经济从而获得最大的盈利,我们也可以尝试将博弈论的思想运用到生活实践中从而获得最优的策略。 比如某一天你觉得应该是你女朋友的生日,但又不能肯定,如果是女朋友的生日的话,你可以送一束花,女朋友会特别高兴,你不送花,女朋友会埋怨你忘了她的生日如果不是女朋友的生日的话,你可以送女朋友一束花女朋友感到意外的惊喜,你不送花结果生活同往常一样。 生日非生日 买花 1 ,1 2 ,1 不买花-1,-1 0 ,0 确定今天是女朋友的生日或确定今天不是女朋友的生日,但你的最好行动都是买花。 谈到博弈论我们不得不说到囚徒困境,其内容大致为两名罪犯A 和B隔离审讯。如果两个都不招,因为证据不充分,两人都只能判1年。如果一方招了,属立功表现,功罪相抵,无罪释放;而另一方则属抗拒从严,判10年刑但如果两人都招了,则各判 5 年。结果大家都知道:两个人争先恐后地招了,结结实实地各判了5年。两个犯

人陷入的就是囚徒困境, A B 招不招 招 5 ,5 无罪释放,10 不招10,无罪释放 1 ,1 其结果就是A和B都招,判5年刑。如果两人协商后选择不招,但如果A或B其中一人招了,另一人就会判10年,而招的一人就会无罪释放,这样的诱惑足以让两名罪犯违背两人协议。而选择招。这样最有可能就是俩人都招。 人际交往中的博弈 人与人之间的相互矛盾和相互冲突的关系实际上就是一种博弈关系。矛盾冲突的结果也有三种情况负和游戏、零和游戏和正和游戏。“负和游戏”是一种两败俱伤的游戏故也称为双输博弈。在人与人的交往时由于相互的冲突和矛盾不能达到统一交际双方都不让步,最后使交际活动不能展开,结果是交际的双方都从中受损两败俱伤。如果是朋友,也会因不断发生“负和游戏”而逐渐疏远,夫妻间经常出现“负和”现象感情自然会受到影响。交际中之所以经常会发生“负和博弈”现象,大多是因为心胸狭窄,遇事爱使性负气,必然会出现“负和”局面。如果不使性负气,而是互相谅解,与人交往采取合作态度,便能使有矛盾和冲突的交际活动朝好的方向发展。在交际中如果遇到了和交际对象发生冲突的时候能够想着退一步海阔天高,采取一种和对方合作的态度就一定能避免交际中“负和游戏”的发生。至于“零和游戏”这种简单的“你输我赢”的思考方式往往会给人们带来更大的麻烦。其实在人与人之间的交往中双方的关系并不是简单

博弈论谢识予第四五章参考答案

第四章参考答案 2、火车站和机场餐饮商业服务的顾客往往都是一次性的,回头客、常客比较少,这些经济交易具有一次性博弈的特征,它们的价格总是较高而质量又会差一些,顾客也会尽量不在这些地方购买商品和消费。在一般商业区和居民区的餐饮商业服务则回头客和常客较多,有明显的重复博弈特征,在居民区购买商品和消费的老顾客一般能得到比较公平、优惠的价格,还能得到较好的服务,甚至有些还可以信用消费(赊账),因此消费者一般会比较放心地消费。这就是现实生活中重复博弈和一次性博弈效率不同的典型例子之一。 3、从研究对象和问题特征看,有限次重复博弈研究的主要是有明确结束时间的(合作、竞争等)关系,无限次重复博弈研究的主要是没有明确结果时间,或者较长期的关系。 从分析方法的角度,动态博弈和重复博弈分析中常用的逆推归纳法在无限次 16 重复博弈中无法直接运用,因为没有最后一次重复。因此无限次重复博弈分析的主要方法是构造法,即根据特定效率意义等构造了博弈完美纳什均衡。此外,也可以运用某些技巧解决问题,如教材中利用三阶段讨价还价博弈分析无限阶段讨价还价博弈的技巧。 从博弈的结果看,无限次重复博弈的效率往往高于有限次重复博弈,有些在有限次重复博弈中无法实现的效率较高的结果,在无限次重复博弈中有可能实现。例如囚徒的困境型博弈的无限次重复博弈和有限次重复博弈就体现了这种差别。两类重复博弈民间定理的差异也说明了这一点。 最后,在重复次数不多的有限次重复博弈中不一定要考虑得益贴现问题,在我限次重复博弈问题中这是必须考虑的。 上述区别在理论方面最主要的启发是重视有限次和无限次重复博弈的区别,区分研究这两类博弈问题是非常重要的,在实践方面的主要启发是促进和保持经济关系的长期稳定性,对于提高社会经济效率等常常有非常重要的意义。 6、用画线法容易找出该博弈的两个纯策略纳什均衡(T,L)和(M,R)。这两个纳什均衡的得益都帕累托劣于(B,S)。一次性博弈中效率较高的(B,S)不可能实现。但该博弈的结构表明存在双方合作的利益,在两次重复博弈中也有构造惩罚机制的条件,因此我会考虑运用试探合作的触发策略争取部分实现(B,S),提高博弈的效率。 我作为博弈方1会采用这样的触发策略:第一次重复采用B;第二次重复时,如果前一次的结果是(B,S),则采用M,如果前一次的结果是其他,则采用T。如果另一个博弈方有同样的分析能力,或者比较有经验,那么他(或她)也会采用相似的触发策略:在第一次重复时采用S;第二次重复时,如果前一次的结果是(B,S),则采用R,否则采用L。 双方采用上述触发策略构成一个子博弈完美纳什均衡,因此是稳定的。这时候前一次重复实现了(B,S),提高了博弈的效率。 当然,上述触发策略也是有风险的,因为当另一个博弈方不理解和没有采用上述策略时,我的得益会较低。当然如果考虑到人们具有学习进步的能力,而且缺乏分析和学习能力,采用效率较低策略的博弈方长期中会逐步被淘汰掉,那么采用上述触发策略的合理性就得到了进一步的支持。

战略风险投资博弈模型分析

战略风险投资博弈模型分析 本文此处将通过对风险投资公司投资处于成长阶段创新企业的活动的分析和研究,提出信号传递博弈模型的企业价值评估方法。通过信号传递博弈模型来分析企业向风险投资公司传递信号(企划书)对价值评估结果的影响,给风险投资公司进一步量化风险和预期投资收益提供思路和参考。 4.1 如何对风险投资目标企业进行价值评估 目前国际上对一个成熟的企业的价值评估一般分为以下五个步骤:分析历史绩效、预测绩效、资本成本评估、连续价值评估、计算并解释结果。这几个步骤有些因为创新企业还远未成熟而无法进行,比如历史绩效分析时很可能财务数据不健全,目标市场价值权数选取时也因为主观预测成分很大而具有很大风险性;最重要一点,由于创新企业急需要注入大笔资金才能继续生存和发展,风险投资公司必须在尽量短的时间内作完考查工作,因为时间价值可谓创新企业的生命价值,错过发展时机肯定是要牺牲的。在这尽量短的时间内,创新企业需要一定的融资技巧,而且有很强的信息优势,风险投资公司除应在投资合约中对其进行约束之外,也要根据自己的观察结果给企业定价,以作为谈判和投资的基础。本文拟引入信息经济学中信号传递博弈模型的企业价值评估方法,风险投资公司结合以往投资经验和统计结果对相应估计结果进行调整,以便客观评估企业的价值及是否值得投资。作为创新企业经营者一方面应利用信息优势影响评价结果,另外对企业有初步的估价以免在价格谈判中贱卖了企业,所以该模型对谈判双方都具有一定的实际价值。 4.2 信号传递博弈模型介绍 信号传递模型(Signaling Games)是一种比较简单但有广泛应用意义的不完全信息动态博弈。在这类博弈中,有两个参与人,i= 1,2,参与人1称信号发送者,参与人2为信号接受者;参与人1的类型是私人信息,参与人2的类型是公共信息。博弈顺序如下: (1)“自然”首先选择参与人1的类型θ∈Ω,此处Ω={θ1,…,θK}是参与人1的类型空间,参与人1知道θ,但参与人2不知道,只知道参与人1属于θ的先

博弈论经典模型全解析

博弈论经典模型全解析(入门级) 1. 囚徒困境这是博弈论中最最经典的案例了——囚徒困境,非常耐人寻味。“囚徒困境”说的是两个囚犯的故事。这两个囚徒一起做坏事,结果被警察发现抓了起来,分别关在两个独立的不能互通信息的牢房里进行审讯。在这种情形下,两个囚犯都可以做出自己的选择:或者供出他的同伙(即与警察合作,从而背叛他的同伙),或者保持沉默(也就是与他的同伙合作,而不是与警察合作)。这两个囚犯都知道,如果他俩都能保持沉默的话,就都会被释放,因为只要他们拒不承认,警方无法给他们定罪。但警方也明白这一点,所以他们就给了这两个囚犯一点儿刺激:如果他们中的一个人背叛,即告发他的同伙,那么他就可以被无罪释放,同时还可以得到一笔奖金。而他的同伙就会被按照最重的罪来判决,并且为了加重惩罚,还要对他施以罚款,作为对告发者的奖赏。当然,如果这两个囚犯互相背叛的话,两个人都会被按照最重的罪来判决,谁也不会得到奖赏。那么,这两个囚犯该怎么办呢?是选择互相合作还是互相背叛?从表面上看,他们应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果:自由。但他们不得不仔细考虑对方可能采取什么选择。A犯不是个傻子,他马上意识到,他根本无法相信他的同伙不

会向警方提供对他不利的证据,然后带着一笔丰厚的奖赏出狱而去,让他独自坐牢。这种想法的诱惑力实在太大了。但他也意识到,他的同伙也不是傻子,也会这样来设想他。所以A犯的结论是,唯一理性的选择就是背叛同伙,把一切都告诉警方,因为如果他的同伙笨得只会保持沉默,那么他就会是那个带奖出狱的幸运者了。而如果他的同伙也根据这个逻辑向警方交代了,那么,A犯反正也得服刑,起码他不必在这之上再被罚款。所以其结果就是,这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应:坐牢。企业在信息化过程中需要与咨询企业、软件供应商打交道的。在与这些企业打交道的过程中,我们不可避免地也会遇到类似的两难境地,这个时候需要相互之间有足够的了解与信任,没有起码的信任做基础,切不可贸然合作。在对对方有了足够的信任之后,诚意也是必不可少的,如果没有诚意或者太过贪婪,就可能闹到双方都没有好处的糟糕情况,造成企业之间的双输。 2. 智猪博弈在博弈论(Game Theory)经济学中,“智猪博弈”是一个着名的纳什均衡的例子。假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;同时到槽边,收益比是

博弈模型分析

1.3 管理型医疗概念研究 - 概念提出 - 博弈关系杨燕绥/王瑶平 - 分析模型岳公正 管理型医疗中的博弈关系:模型分析 (暂题) 概括地讲,管理型医疗是一种主要由医院(或者医生)、患者(或者受益人)、医疗保险管理机构(或者医疗保险经办机构)、政府四方参与的管理过程,是建立在互惠基础上的进行多方合作的医疗社会管理机制。由于经济发展水平、人文环境、行政管理具体情况等的不同,各个国家和地区的管理型医疗的结构和内容应当有其特点,具体操作方式和方法也很自然地存在差异。但是,从逻辑实质看,各个国家和地区存在着诸多差异的管理型医疗在本质上都是一个由医院、患者、医疗保险管理机构、政府四方围绕医疗服务定价、服务标准和成本控制等问题进行协商、规范和监督的管理过程。 本节的研究内容:1、对于管理型医疗中的博弈关系进行划分;2、对于管理型医疗中主要的博弈关系进行分析。 1 管理型医疗中博弈关系的划分 一般分析,医疗保险涉及的主体主要由医院、患者、医疗保险管理机构、政府四方组成。但是,在通常情况下,医疗保险在实际操作上涉及的主体还包括参保人、缴费人、受益人、基金管理公司、基金托管机构、医疗服务机构(营利和非营利)、药店、类似医生协会和药品协会的NGO组织、社会保障部门和卫生部门、监督评价机构等等。如何将这些组织和机构协调起来,从而降低医疗费用,提高医疗服务的质量是管理型医疗的主要内容。

图1-3—1 医疗保险的运行关系1 依据图1-3—1分析,医疗保险的运行中,包括了多元主体(医院、医疗保险经办机构、雇主、雇员、药店等)之间复杂的多维的相互制约与相互影响的关系。 1、医院和医疗保险经办机构的关系; 2、医院和受益人的关系; 3、医疗保险经办机构和受益人的关系; 4、医疗保险经办机构和药店的关系; 5、受益人和药店的关系; 6、医疗保险经办机构和政府的关系; 7、医疗保险经办机构和雇主(企业)的关系; 8、医疗保险经办机构和雇员(患者、投保人)的关系; 9、雇主和雇员的关系; 1杨燕绥著:《劳动与社会保障立法国际比较研究》,第239页,中国劳动社会保障出版社,2001年

重复博弈

影响重复博弈均衡结果的主要因素是博弈重复的次数和信息的完备性。再重复博弈中,参与人存在着短期利益和长远利益的均衡,有可能为了长远利益牺牲短期利益而选择不同的均衡策略。 有限次重复博弈和无限次重复博弈。 什么是有限次重复博弈 有限次重复博弈是指相同结构的博弈有限次重复进行 无限次重复博弈与有限次重复博弈的共同点:试图“合作”和惩罚“不合作”是实现理想均衡的关键 所谓重复博弈,是指将一个博弈重复进行下去。我们知道,在单个的囚徒困境博弈中,双方采取对抗的策略可使个人收益最大化 如果就一次性博弈来看,(对抗,对抗)是必然的结果 恋人们之间的博弈。 重复博弈同样可以用来解释商业行为。 ■诚信来自重复博弈 :“诚信奇迹无人卖报摊三年口袋里从没少过钱”。 ,吴师傅的关于“不敢拿”的判断,似乎更为符合博弈学原理。我们可以把这个“诚信报摊”看作摊主与买报人之间的博弈,而从博弈过程来看,“诚信报摊”成立第一天那种“每个博弈者都只关心一次性支付的简单博弈”已经转变成了“重复的、连续进行的博弈” “有仇就报,马上就报”如果用博弈论的观点来解释,则可以简单地描述为“针锋相对策略”。。 这个如此简单的策略之所以反复赢得竞赛,是因为它奉行了针锋相对的法则,说白了就是一报还一报,即“人不犯我,我不犯人;人若犯我,我必犯人”,但它坚持“有理、有利、有节”的尺度,并且用以下有规律可供遵循的行为将对手纳入长期合作的轨道上来: 第一,善良的,即从不首先背叛; 第二,可激怒的,对于对方的背叛行为一定要报复,不能总是合作;

第三,宽容的,不能人家一次背叛,你就没完没了地报复,以后人家只要改为合作,你也要合作; 第四,易于察觉的,即逻辑清晰,使对手能够很轻易地发现你采取策略的规律,并且领会你的意图。 “针锋相对策略”在实际生活中可以被广泛地应用: 重复博弈:冲突与合作方能共存 一、军队的群体目标下的多人重复博弈 高度统一的一致行动的能力,这就是我们通常所说的战斗力,这是军队能遂行各种任务的前提。为了实现这一群体目标,军队对于其成员关系、交往方式、群体意识都作了严格的要求,对于分工和群体内规范也都作了细致的安排。除了这些以外,军队还必须把搞好内部团结,维护整体利益的原则作为管理的一般标准。 二、权威型的管理方式下的管理策略要求

(完整word版)经典的博弈论分析案例——“海盗分金”问题

经典的博弈论分析案例——“海盗分金”问题 5个海盗抢得100枚金币,他们按抽签的顺序依次提方案:首先由1号提出分配方案,然后5人表决,超过半数同意方案才被通过,否则他将被扔入大海喂鲨鱼,依此类推。 “海盗分金”其实是一个高度简化和抽象的模型,体现了博弈的思想。在“海盗分金”模型中,任何“分配者”想让自己的方案获得通过的关键是事先考虑清楚“挑战者”的分配方案是什么,并用最小的代价获取最大收益,拉拢“挑战者”分配方案中最不得意的人们。 假设前提 假定“每个海盗都是绝顶聪明且很理智”,那么“第一个海盗提出怎样的分配方案才能够使自己的收益最大化?” 推理过程 从后向前推,如果1至3号强盗都喂了鲨鱼,只剩4号和5号的话,5号一定投反对票让4号喂鲨鱼,以独吞全部金币。所以,4号惟有支持3号才能保命。 3号知道这一点,就会提出(100,0,0)的分配方案,对4号、5号一毛不拔而将全部金币归为已有,因为他知道4号一无所获但还是会投赞成票,再加上自己一票,他的方案即可通过。 不过,2号推知3号的方案,就会提出(98,0,1,1)的方案,即放弃3号,而给予4号和5号各一枚金币。由于该方案对于4号和5号来说比在3号分配时更为有利,他们将支持他而不希望他出局而由3号来分配。这样,2号将拿走98枚金币。 同样,2号的方案也会被1号所洞悉,1号并将提出(97,0,1,2,0)或(97,0,1,0,2)的方案,即放弃2号,而给3号一枚金币,同时给4号(或5号)2枚金币。由于1号的这一方案对于3号和4号(或5号)来说,相比2号分配时更优,他们将投1号的赞成票,再加上1号自己的票,1号的方案可获通过,97枚金币可轻松落入囊中。这无疑是1号能够获取最大收益的方案了!答案是:1号强盗分给3号1枚金币,分给4号或5号强盗2枚,自己独得97枚。分配方案可写成(97,0,1,2,0)或(97,0,1,0,2)。分析 1号看起来最有可能喂鲨鱼,但他牢牢地把握住先发优势,结果不但消除了死亡威胁,还收益最大。这不正是全球化过程中先进国家的先发优势吗?而5号,看起来最安全,没有死亡的威胁,甚至还能坐收渔人之利,却因不得不看别人脸色行事而只能分得一小杯羹。 不过,模型任意改变一个假设条件,最终结果都不一样。而现实世界远比模型复杂。 首先,现实中肯定不会是人人都“绝对理性”。回到“海盗分金”的模型中,只要3号、4号或5号中有一个人偏离了绝对聪明的假设,海盗1号无论怎么分都可能会被扔到海里去了。所以,1号首先要考虑的就是他的海盗兄弟们的聪明和理性究竟靠得住靠不住,否则先分者倒霉。 如果某人偏好看同伙被扔进海里喂鲨鱼。果真如此,1号自以为得意的方案岂不成了自掘坟墓! 再就是俗话所说的“人心隔肚皮”。由于信息不对称,谎言和虚假承诺就大有用武之地,而阴谋也会像杂草般疯长,并借机获益。如果2号对3、4、5

博弈模型

有趣味的博弈论模型 按语: 本文已经发表在“百科知识”2009年6月下半月总第413期第14-15页;在今年2月下半月总第405期第11-13页上发表了“网络科学三大里程碑”;2005年11月上半月总第326期第21-22页发表了“网络科学的三大发现”。令我意外的是去年在网上偶然发现“共检索到 10 条读者推荐文章”(请看最后附录),这篇科普文章名列首位,我们还有一篇文章名列第七。如果读者有兴趣可以去看看,或等我有时间找出来。我觉得,把新兴科学应用通俗易懂的语言写出来,有利于科学知识普及。这也应该是一个科学工作者的责任。 在自然界和人类社会经济等领域中广泛存在合作与竞争,而能够反映这种既激烈竞争又需要合作的一门学科就是博弈论(Game Theory),也称对策论,它是模拟和分析理性的个体在利益冲突环境下相互作用的形式、决策及其均衡理论,研究个体之间行为的相互影响和相互作用规律,它可以描述现实生活中参与者面对有限资源的合作与竞争行为。令人惊奇的是,有三次诺贝尔获奖者是博弈论的杰出科学家,他们是1985年获得诺贝尔奖的公共选择学派的领导者布坎南,1994年经济学诺贝尔奖颁发给美国普林斯顿大学的纳什博士、塞尔屯、哈桑尼3位博弈论专家,1995年获奖的理性主义学派的领袖卢卡斯。博弈论在经济学、政治学、管理学、社会学、军事学、生物学等诸多学科领域具有广泛的实际背景和应用价值。进入20世纪末,随着复杂网络科学的一些新的发现,博弈论也成为网络时代人们的一种思维方式、竞争与合作的模式。 博弈论对人有一个最基本假定:人是理性的,人在具体策略选择的目的全是使自己的利益最大化。博弈论就是研究理性的人之间如何进行策略选择的,因此博弈论也称为对策论。博弈论就凭这么一条最简单的假定可以展开广泛的研究,并获得了丰富多彩的结果,利用博弈论可以解读人类的社会行动或集体行动,更易理解人类社会的复杂性和特殊性。为了刻画个体间利益的冲突对整个系统的影响,人们已经提出和研究了许多博弈模型,比较著名的有三个模型:囚徒困境、“雪堆”博弈和“少数者”博弈,下面笔者通过对这三个模型进行简单而通俗的介绍,让大家了解博弈论及其应用概况。 “囚徒困境”模型 囚徒困境作为一个经典的博弈模型受到广泛关注。这个博弈模型假设两个小偷合伙作案时被捕,分别关在不同的屋子里,如果双方都拒绝承认同伴的罪行,则由于证据不足两人都会被轻判(收益为);为此,警方设计了一个机制:如果一方出卖同伴,而另一方保持忠 诚,则背叛者将无罪释放(收益为T ) ;坚持忠诚的一方将被重判(收益为);如果双方都背叛了对方,则双方都会被判刑(收益为R S P ) 。这里假设上述收益参数满足下面的条件:。对每个参与者来说,如果对手坚持忠诚,则他也选择忠诚得到的收益T R P S >>>R 小于他选择背叛得到的收益T ;如果对手选择背叛,则他选择忠诚得到的收益仍小于他选择背叛得到的收益。 S P 可见,无论对手采取哪种策略,自己的最佳策略就是背叛,双方都选择背叛称为囚徒困境的唯一“纳什均衡”(纳什因其提出的“非合作完全信息博弈的纳什均衡”概念而荣获了1994年的诺贝尔获得经济学奖);同时选择背叛所取得的平均收益要低于两个人同时选择合作取得的平均收益。在这种情况下,理性参与者面临着两难的困境。 自然界中广泛存在的合作现象——从单细胞生物的协同工作到人类的无私奉献的行为

第五章-博弈论与竞争策略

第五章博弈论与竞争策略 第一节第二节第三节博弈论的基本概念完全信息静态博弈重复博弈和序列博弈 在现实经济社会,完全垄断和完全竞争的市场结构十分少见。厂商在市场中既有一定的垄断势力,又面临很大的竞争压力。厂商之间具有相关性和依存性。因此,可以用博弈论的方法解释和说明厂商的竞争行为和策略。博弈论是70年代中期以来微观经济学发展的一个重要方面。1994年的诺贝尔经济学奖被授予博弈论专家:纳什(Nash)、泽尔腾(Selten)和海萨尼(Harsanyi),他们都对博弈论在经济学中的应用作出了贡献。 70年代以来,博弈论已经发展成为现代经济学的基础重要基础之一,改变了传统经济学的结构,这主要有两 个方面的原因: 1.传统经济学着重研究市场机制和价格制度,分析完全竞争市场中的最优决策,不考虑决策者之间的相互影响。但是,现实经济运行中市场是不完全竞争的,行为主体之间的决策具有相互影响。 2.完全竞争市场是以完全信息为条件的,这在现实经济运行中也难以保证。在信息不对称条件下,考虑行为主体相互影响的非价格制度可以用博弈论分析。 当然,应用博弈论解决竞争策略问题也是有条件的。除了掌握博弈论方法外,关键是正确估计各参与者的策略空间和收益函数。 第一节博弈论的基本概念 一.博弈论及其特点 1.博弈和博弈论 博弈是指具有不同利益和目标的多个行为主体共同参加并相互影响的事态发展过程中的策略决策。 博弈论(Game Theory)也称对策论,它是一种分析博弈过程和结果的数学方法,研究具有理性的多个行为主体的决策和行动直接相互作用和影响时,事态发展过程的决策和均衡问题。广泛应用于政治、军事、经济、外交和日常生活的许多领域。 2.特点: (1)参与者具有各自的目标: (2)参与者都是理性行为者; (3)参与者之间具有相关性; (4)事态发展的结果取决于全部参与者的共同行为; (5)参与者要根据对其他参与者的判断决定自己的行动,因而是对策。 可见,博弈论是与优化论不同的决策理论。优化论是一种单人决策理论;博弈论所揭示的规律是一种多人决策理论。 二.博弈论的基本概念 在博弈论中,博弈的基本要素被概括为以下概念: 1)参与者Players (玩家):即参加博弈过程的行为和决策主体,也是利益主体。在一个博弈中,最少要有两个参与者。 2)策略Strategies (战略或策略行为):即参与者在某个博弈时点,根据其掌握的有关博弈信息而选择的决策变量和行动计划,一个参与者的全部可行策略称为他的策略空间。 接上页 3)收益Payoff(支付、得益)和收益函数:收益是指在既定策略组合条件下参与者的得失情况。每个参与者的收益取决于全部参与者所采取的策略,称为收益函数。 4)结局 outcome(结果):指博弈的结果,指既定策略组合条件下全部参与者所得收益的集合。 5)均衡 Equilibrium (均势):指达到稳定的策略组合或结局。 6)博弈规则:指参与者、策略、结局之间的联系。它是由博弈的环境和参与者之间的相互影响决定的。 例: 可口可乐与百事可乐(参与者)的价格决策: 双方都可以保持价格不变或者提高价格(策略) 博弈的目标和得失情况体现为利润的多少(收益) 利润的大小取决于双方的策略组合(收益函数) 博弈有四种策略组合,其结局是: (1)如果双方都不涨价,各得利润10单位; (2)如果可口可乐不涨价,百事可乐涨价,可口可乐利润100,百事可乐利润-30; (3)如果可口可乐涨价,百事可乐不涨价,可口可乐利润-20,百事可乐利润30;

范里安《微观经济学:现代观点》名校考研真题详解-第五章 博弈论及其应用【圣才出品】

第五章博弈论及其应用 第一节博弈论 一、名词解释 1.纳什均衡(华中科技大学2002研;东南大学2003研;厦门大学2006研;中央财经大学2012研) 答:纳什均衡(Nash Equilibrium)又称为非合作均衡,是博弈论的一个重要术语,以提出者约翰·纳什的名字命名。纳什均衡是指这样一种策略集,在这一策略集中,每一个博弈者都确信,在给定竞争对手策略的情况下,他选择了最好的策略。纳什均衡是由所有参与人的最优战略所组成的一个战略组合,也就是说,给定其他人的战略,任何个人都没有积极性去选择其他战略,从而没有人有积极性去打破这个均衡。 2.混合策略(Mixed Strategy)(厦门大学2010研) 答:混合策略(mixed strategy)指参与人使他们的策略选择随机化——即对每项选择都指定一个概率,并按照这些概率选择策略。混合策略纳什均衡是这样一种均衡,在这种均衡下,给定其他参与人的策略选择概率,每个参与人都为自己确定了选择每一种策略的最优概率。混合策略是相对于纯策略而言的。并不是所有的博弈都存在纯策略纳什均衡,但是混合策略均衡总是存在的。 3.合作博弈(厦门大学2012研) 答:合作博弈是指各博弈方可以谈定能使它们设计联合策略的有约束力的合同的博弈。

厂商之间进行的经济博弈既可以是合作的也可以是非合作的。如果不可能谈判并执行有约束力的合同,博弈就是非合作的;如果能设计出合同,则是合作的。 合作博弈的一个例子是买方和卖方之间就一块地毯的价格讨价还价。如果地毯生产成本为100美元,而买方对其评价是200美元,因为双方同意以101~199美元之间任一价格成交都将最大化买方的消费者剩余与卖方的利润之和,并使双方都得到好处,因此该博弈可能有合作的解。 合作和非合作博弈之间的基本差别在于签订合同的可能性,在合作博弈中有约束力的合同是可能存在的,而在非合作博弈中它们是不可能的。 二、单项选择题 1.考虑两寡头厂商A 和B 的如下支付矩阵,二者的(纳什)均衡策略组合为( )。 (电子科技大学2010研) A.() U L ,B.() D R ,C.() U R ,D.() D L ,【答案】B 【解析】在一个纳什均衡里,任何一个参与者都不会改变自己的最优策略,如果其他参与者均不改变各自的最优策略,即要求任何一个参与者在其他参与者的最优策略选择给定的条件下,其选择的策略也是最优的。对于本题,当B 选择U 时,A 会选择R,因为5>3;

博弈论案例分析1

一、经济学中的“智猪博弈”(Pigs’payoffs) 故事背景:猪圈里有一头大猪和一头小猪。猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。 那么,两只猪各会采取什么策略?答案是:小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。 原因何在?因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲力亲为了。 “小猪躺着大猪跑”的现象是由于故事中的游戏规则所导致的。规则的核心指标是:每次落下的事物数量和踏板与投食口之间的距离。 如果改变一下核心指标,猪圈里还会出现同样的“小猪躺着大猪跑”的景象吗?试试看。 改变方案一:减量方案。投食仅原来的一半分量。结果是小猪大猪都不去踩踏板了。小猪去踩,大猪将会把食物吃完;大猪去踩,小猪将也会把食物吃完。谁去踩踏板,就意味着为对方贡献食物,所以谁也不会有踩踏板的动力了。 如果目的是想让猪们去多踩踏板,这个游戏规则的设计显然是失败的。 改变方案二:增量方案。投食为原来的一倍分量。结果是小猪、大猪都会去踩踏板。谁想吃,谁就会去踩踏板。反正对方不会一次把食物吃完。小猪和大猪相当于生活在物质相对丰富的“共产主义”社会,所以竞争意识却不会很强。 对于游戏规则的设计者来说,这个规则的成本相当高(每次提供双份的食物);而且因为竞争不强烈,想让猪们去多踩踏板的效果并不好。 改变方案三:减量加移位方案。投食仅原来的一半分量,但同时将投食口移到踏板附近。结果呢,小猪和大猪都在拼命地抢着踩踏板。等待者不得食,而多劳者多得。每次的收获刚好消费完。 对于游戏设计者,这是一个最好的方案。成本不高,但收获最大。 原版的“智猪博弈”故事给了竞争中的弱者(小猪)以等待为最佳策略的启发。但是对于社会而言,因为小猪未能参与竞争,小猪搭便车时的社会资源配置的并不是最佳状态。为使资源最有效配置,规则的设计者是不愿看见有人搭便车的,政府如此,公司的老板也是如此。而能否完全杜绝“搭便车”现象,就要看游戏规则的核心指标设置是否合适了。 比如,公司的激励制度设计,奖励力度太大,又是持股,又是期权,公司职员个个都成了百万富翁,成本高不说,员工的积极性并不一定很高。这相当于“智猪博弈”增量方案所描述的情形。但是如果奖励力度不大,而且见者有份(不劳动的“小猪”也有),一度十分努力的大猪也不会有动力了----就像“智猪博弈”

博弈均衡模型及其举例

博弈联均衡模型 博弈论模型图示 博弈可划分为合作博弈和非合作博弈,1人们一般讲到的都是指非合作博弈,它有四种不同类型的博弈,即完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈、不完全信息动态博弈,与上述相对应的是纳什均衡、子博弈精炼纳什均衡、贝叶斯纳什均衡、精炼贝叶斯纳什均衡。这四种均衡中最为基本的是纳什均衡。2 完全信息静态博弈——纳什均衡、 完全信息动态博弈——子博弈精炼纳什均衡 不完全信息静态博弈——贝叶斯纳什均衡、、 不完全信息动态博弈——精炼贝叶斯纳什均衡, 与上述相对应的是、、、。这四种均衡中最为基本的是纳什均衡。 完全信息静态博弈(纳什均衡) 债务人 强硬妥协 1这两者的区别主要在于人们的行为相互作用时,当事人能否达成一个有约束力的协议:如能达成就是合作博弈;反之就是非合作博弈。合作博弈强调团体理性,强调效率和公平,非合作博弈强调理性个人的最优决策,其结果是否有效率则是不确定的。 2所谓纳什均衡,指的是所有参与人最优选择的一种组合,在这种组合下,给定其他人的选择,没有任何人有积极性做出新的选择。纳什均衡的哲学思想是:给定别人遵守协议的情况下,没有人有积极性偏离协议规定的自己的行为规则。换言之,如果一个协议不构成纳什均衡,它就不可能自动实施,因为至少有一个参与人会违背这个协议,不满足纳什均衡要求的协议是没有意义的。当博弈中的所有参与人事先达成一项协议,给出每个人的行为规则。在没有外在强制力约束时,当事人是否会自觉地遵守这个协议?或者说这个协议是否可以自动实施?如果当事人会自觉遵守这个协议,等于说这个协议构成一个纳什均衡。参见张维迎:“经济学家看法律、文化与历史”,载张维迎《产权、政府与信誉》,三联书店2001年版。

博弈论模型案例分析报告报告材料

利用古诺双寡头模型来分析案例 1 案例 在目前竞争的市场上主打的两种可乐是可口可乐和百事可乐,几乎垄断了整个市场,在生产过程中,他们都了解对方的策略。据统计他们的产量接近于Q/3,其中Q 为市场总容量,问题1是:为什么这个市场会这样发展? 2 建立古诺双寡头模型 根据以上案例可以采取古诺双寡头模型来分析问题,该模型假定市场只有两个卖者,商品是同质的,并且假设他们共同面临的市场的需求曲线是线性的,相互间没有任何勾结行为,但相互间都知道对方将怎样行动,从而各自怎样确定最优的产量来实现利润最大化。 这个博弈的参与人是两家公司,在该模型下,把两种可乐看成是同质商品,在这个博弈中生产成本就是C*Q ,生产一单位商品的成本是C 。根据需求曲线图,可乐属于正常品,两家企业生产得越多,该商品的价格就越低。价格取决于两个参数:a &b ,b 为需求曲线的斜率。)(21q q b a P +-= ------① 这些公司的目标是利润最大化,公司1的利润跟q1,q2有关, 图1需求曲线 总产量Q=q1+q2 0 m q

11211,q c q p q q u *-*=) (,把①式中的价格p 带入得122 111cq q bq bq aq u ---=②,同理可得,22222212),(cq q bq bq aq q q u ---=③。 2.1我们可以尝试找出纳什均衡: 方法:把每个人的最佳对策看成别人策略的函数,然后找出函数的交点。参与人1对于2不同产量下的最佳产量,然后反过来,在参与人1的不同产量下,参与人2的最佳产量。即在不同的q2下q1取什么值才能最大化利润。 ②式对q1求导后,令导数为0,并且验证2阶条件,发现其小于0 ,所以是最大值,就得出参与人2不同策略下参与人1的最佳对策,2/2/)(21q b c a q --=,同理可得2/2/)(12q b c a q --=。 2.2参与人1的最佳对策选择过程如下: 假如参与人2的产量为0时,参与人1的最佳对策是为(a-c )/2b ,形成垄断产量,表现在图1为边际收入等于边际成本的产量m q ;再是公司2的产量为多少时公司1停产,在图1表现为边际成本与需求曲线的交点处,即公司2的产量一直增加到(a-c )/b 时,因为市场上该产品的产量跟价格成反比,因此当公司2增加产量时每件产品必然降价。这个点就是完全竞争产量。在完全竞争市场中,这就是最终的市场价格。现在我们算出垄断产量跟完全竞争产量,二者之间的关系是直线。 下面做出这些函数的图形,横轴表示产量,这表示参与人1的策略,纵轴表示参与人2的策略。下面的曲线就是说在给定q2的产量情况下,q1的最佳对策是多少产量。那么反过来,给定q1的产量情况下,q2的最佳对策是多少产量,是关于45度线的对称线。这个图的纳什均衡点就是两条线的交点产量为q1*=q2*=(a-c)/3b ,即最佳决策点的交点A 。这就是古诺模型的纳什均衡点。

博弈论的应用-浅析博弈论经典模型

浅析博弈论经典模型 --囚徒困境模型及其启示 一、博弈论概述 博弈论又名“对策论”、“赛局理论”,属应用数学的一个分支,表示在多决策主体之间行为具有相互作用时,各主体根据所掌握信息及对自身能力的认知,做出有利于自己的决策的一种行为理论。简单说来就是一些个人或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。由于冲突、合作、竞争等行为是现实世界中常见的现象,因此很多领域都能应用博弈论,例如军事领域、经济领域、政治外交,解决诸如战术攻防、国际纠纷、定价定产、兼并收购、投标拍卖甚至动物进化等问题。 二、博弈论的基本原理 从上述定义中可以看出,一个完整的博弈一般由以下几个要素组成:博弈的参加者,各博弈方各自选择的全部策略或行为的集合、博弈方的得益、结果、均衡等。 1、参与者指的是博弈中选择行动以最大化自己效用的决策主体(可以是个人,也可以是团体)。 2、行动是指参与人在博弈进程中轮到自己选择时所作的某个具体决策。 3、策略是指参与人选择行动的规则,即在博弈进程中,什么情况下选择什么行动的预先安排。 4、信息指的是参与人在博弈中所知道的关于自己以及其他参与人的行动、策略及其得益函数等知识。

5、得益是参与人在博弈结束后从博弈中获得的效用,一般是所有参与人的策略或行动的函数,这是每个参与人最关心的事情。 6、均衡是所有参与人的最优策略或行动的组合;均衡结果是指博弈结束后博弈分析者感兴趣的一些要素的集合,如在各参与人的均衡策略作用下,各参与人最终的行动或效用集合。 上述要素中,参与人、行动和结果统称为博弈规则,博弈分析的目的是使用博弈规则来决定均衡。 三、博弈的分类 博弈的分类根据不同的标准也有不同的分类。 根据参与人的多少,博弈可以分为二人博弈和多人博弈。 根据参与人是否合作,博弈可以分为合作博弈和非合作博弈。合作博弈和非合作博弈的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议,如果有,就是合作博弈,如果没有,就是非合作博弈。 根据各方得益的不同情况,博弈可以分为零和博弈和变和博弈。零和博弈中各方利益之间是完全对立的。变和博弈有可能存在合作关系,争取双赢的局面。 根据行为的时间序列性,博弈可以分为静态博弈、动态博弈。静态博弈是指在博弈中,参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动;动态博弈是指在博弈中,参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。 根据参与人对其他参与人的了解程度,博弈可以分为完全信息博弈和不完全信息博弈。完全信息博弈是指在博弈过程中,每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息。不完全信息博弈是指如果参与人对其他参与人的特征、策略空间及收益函数信息了解

相关文档
最新文档