纳什均衡模型

合集下载

纳什均衡点经济学

纳什均衡点经济学

纳什均衡点经济学1950年,约翰·纳什在普林斯顿读博士学位期间,提出了“纳什均衡”的概念,他将冯·诺依曼的“最小最大原理”推广到非合作博弈领域,并找到了普遍化的方法和均衡点。

同年,纳什把自己的研究成果写成题为“非合作博弈”的长篇博士论文。

1951年,纳什又发表了相关论文,进一步完善了纳什均衡的理论,他证明了非合作博弈及其均衡解的存在性,其证明使用了布劳威尔不动点定理,后来又使用了Kakutani不动点定理给出了更简单的证明,纳什均衡的提出奠定了现代非合作博弈论的基石。

纳什均衡理论的含义是在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。

如果两个博弈的当事人的策略组合分别构成各自的支配性策略,那么这个组合就被定义为纳什均衡。

简单来说,纳什均衡是一种策略组合,在这种组合下,每个参与者都没有动机去单方面改变自己的策略,因为改变策略不会给自己带来更好的收益。

在经典的“囚徒困境”中,两个犯罪嫌疑人被分开审讯。

如果两人都保持沉默(合作),每人会被判刑1年;如果一人坦白(背叛)而另一人沉默,坦白的人会被释放,沉默的人会被判刑10年;如果两人都坦白,每人会被判刑5年。

对于每个囚徒来说,无论对方选择什么策略,坦白都是自己的最优策略。

所以(坦白,坦白)就是这个博弈的纳什均衡点。

纳什均衡点的形成依靠参与者的理性决策和相互预期及策略调整。

纳什均衡假设参与者是理性的,他们会在考虑对方可能采取的策略的基础上,选择使自己利益最大化的策略。

每个参与者都对各种策略组合下自己的收益有清晰的认识,并通过比较来做出决策。

参与者会对其他参与者的策略进行预期。

在多次博弈或者信息足够的情况下,他们会不断调整自己的策略,直到达到一种稳定的状态,即纳什均衡。

例如,在市场竞争中,两家企业会考虑对方的价格策略来调整自己的价格,当双方都认为自己的价格策略是在对方价格策略下的最优选择时,就形成了纳什均衡。

解释为什么古诺模型的均衡是一个纳什均衡

解释为什么古诺模型的均衡是一个纳什均衡

解释为什么古诺模型的均衡是一个纳什均衡古诺模型又称古诺双寡头模型(Cournot duopoly model),或双寡头模型(Duopoly model),古诺模型是早期的寡头模型。

需求曲线上的古诺模型它是由法国经济学家古诺于1838年提出的。

是纳什均衡应用的最早版本,古诺模型通常被作为寡头理论分析的出发点。

古诺模型是一个只有两个寡头厂商的简单模型,该模型也被称为“双头模型”。

古诺模型的结论可以很容易地推广到三个或三个以上的寡头厂商的情况中去。

古诺模型假定一种产品市场只有两个卖者,并且相互间没有任何勾结行为,但相互间都知道对方将怎样行动,从而各自怎样确定最优的产量来实现利润最大化,因此,古诺模型又称为双头垄断理论。

古诺模型中的双寡头厂商均衡就是纳什均衡。

纳什均衡就是双方都坦白,给定甲坦白的情况下,乙的最优策略是坦白;给定乙坦白的情况下,甲的最优策略也是坦白。

而且这里双方都坦白不仅是纳什均衡,而且是一个上策(dominantstrategy)均衡,即不论对方如何选择,个人的最优选择是坦白。

因为如果乙不坦白,甲坦白的话就被轻判1年,不坦白的话就判2年,坦白比不坦白要好;如果乙坦白,甲坦白的话判5年,不坦白的话判10年,所以,坦白仍然比不坦白要好。

这样,坦白就是甲的上策,当然也是乙的上策。

其结果是双方都坦白。

囚徒困境反映了个人理性与集体理性的矛盾。

其实,如果两个囚徒都不坦白,他们各判2年,比都坦白各判5年的情况要好。

但这不符合个人理性,甚至即使这两个囚徒在被抓之前协议,被抓后拒不坦白,但是又有谁有遵守这个协议的积极性呢。

寡头垄断厂商经常发现它们自己处于一种囚徒的困境。

当寡头厂商选择产量时,如果寡头厂商们联合起来形成卡特尔,选择垄断利润最大化产量,每个厂商都可以得到更多的利润。

但卡特尔协定不是一个纳什均衡,因为给定双方遵守协议的情况下,每个厂商都想增加生产,结果是每个厂商都只得到纳什均衡产量的利润,它远小于卡特尔产量下的利润。

纳什均衡

纳什均衡

纳什均衡纳什均衡,又称为非合作赛局平衡,是博弈论的一个重要概念,以约翰·纳什命名。

如果某情况下无一参与者可以独自行动而增加收益,则此策略组合被称为纳什均衡点。

1.基本定义假设有n个局中人参与博弈,给定其他人策略的条件下,每个局中人选择自己的最优策略(个人最优策略可能依赖于也可能不依赖于他人的战略),从而使自己利益最大化。

所有局中人策略构成一个策略组合(Strategy Profile)。

纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。

即在给定别人策略的情况下,没有人有足够理由打破这种均衡。

纳什均衡,从实质上说,是一种非合作博弈状态。

纳什均衡达成时,并不意味着博弈双方都处于不动的状态,在顺序博弈中这个均衡是在博弈者连续的动作与反应中达成的。

纳什均衡也不意味着博弈双方达到了一个整体的最优状态。

2. 具体分类纳什均衡可以分成两类:“纯战略纳什均衡”和“混合战略纳什均衡”。

要说明纯战略纳什均衡和混合战略纳什均衡,要先说明纯战略和混合战略。

所谓纯战略是提供给玩家要如何进行赛局的一个完整的定义。

特别地是,纯战略决定在任何一种情况下要做的移动。

战略集合是由玩家能够施行的纯战略所组成的集合。

而混合战略是对每个纯战略分配一个机率而形成的战略。

混合战略允许玩家随机选择一个纯战略。

混合战略博弈均衡中要用概率计算,因为每一种策略都是随机的,达到某一概率时,可以实现支付最优。

因为机率是连续的,所以即使战略集合是有限的,也会有无限多个混合战略。

当然,严格来说,每个纯战略都是一个“退化”的混合战略,某一特定纯战略的机率为1,其他的则为0。

故“纯战略纳什均衡”,即参与之中的所有玩家都玩纯战略;而相应的“混合战略纳什均衡”,之中至少有一位玩家玩混合战略。

并不是每个赛局都会有纯战略纳什均衡,例如“钱币问题"就只有混合战略纳什均衡,而没有纯战略纳什均衡。

不过,还是有许多赛局有纯战略纳什均衡(如协调赛局,囚徒困境和猎鹿赛局)。

博弈论学习笔记(七)纳什均衡伯川德模型与选民投票

博弈论学习笔记(七)纳什均衡伯川德模型与选民投票

博弈论学习笔记(七)纳什均衡伯川德模型与选民投票古诺模型复习在古诺模型中,多少如我们所预料的,事情很⾃然的处于极端情况之间,即⾏业产量在某种程度上是介于在垄断和完全竞争两种情况之间的。

它⽐在垄断下的价格低,⽐在完全竞争下的价格⾼;⾏业利润⽐垄断下的利润低,⽐完全竞争时的利润⾼。

如果想要得到不完全竞争的局⾯,他么他就在垄断与完全竞争之间。

但是在另外⼀种情况下能够得到⼀种完全拨通的模型 -- 伯川德竞争(Bertrand competition)。

伯川德模型的饮料案例同样是卖饮料,但是这次的的策略是每单位商品的价格p,我们设:有两个参与者1和2,他们分别卖可⼝可乐和百事可乐。

参与者i的出价策略为p i,i=1,2。

编辑成本为c。

对于参与者1,对于不同的出价p1,对应的销量q1为:当p1<p2,q1=1-p1当p1>p2,q1=0当p1=p2,q1=(1-p1)/2这种情况下p1=p2=c为纳什均衡。

如果参与者1选择某个⼤于c的价格p1=c+3*ε,参与者2就会选择⼀个较⼩的价格,如p2c+2*ε,从⽽迫使价格趋向于两者都为编辑价格c,达到纳什均衡。

选民投票n个⼈的政治⽴场平均分布在⼀条直线上,其中越左边的⼈的政治⽴场⽉偏向于左翼,越右边的⼈的政治⽴场⽉偏向于右翼。

他们可以选择竞选总统或者作为选民。

如果他们作为选民,那么他们的选票将会投给离他⾃⼰政治⽴场最近的⼀个参选者。

如果有位置⼀样的则平分。

举个例⼦,如果现在在x位置有⼀个⼈如果x位置的⼈参选并且获胜,他将得到收益b-c(这⾥假设b=2*c,c是竞选的成本)如果x位置的⼈参选y位置的⼈获胜,他将得到收益-c-|x-y| 若果x位置的⼈没有竞选总统,⽽离他最近的y位置的⼈赢得了竞选,他将得到的收益为-|x-y|假设n为奇数,如果现在每个位置平均只有⼀个⼈,那么:只有中间那⼀个⼈竞选是纳什均衡,因为当他竞选时不管是他左边有个⼈想站出来竞选还是他右边有个⼈想站出来竞选都不会成功。

纳什讨价还价博弈模型与实例

纳什讨价还价博弈模型与实例

纳什讨价还价博弈模型与实例在经济学中,博弈论是研究决策制定和策略选择的重要理论工具。

纳什讨价还价博弈模型是博弈论中的一种典型模型,用于分析参与者在讨价还价过程中的策略选择和效用最大化问题。

本文将介绍纳什讨价还价博弈模型的基本概念和数学表达,并结合实际案例进行解析。

一、纳什讨价还价博弈模型的基本概念纳什讨价还价博弈模型是由约翰·纳什提出的,用于分析多方参与者在讨价还价过程中的策略选择和达成协议的问题。

在博弈模型中,每个参与者都会追求自己的最大化利益,通过制定合适的策略来达到目标。

在讨价还价过程中,参与者可以选择不同的策略,例如提出高价、低价或中等价位,以实现自己的利益最大化。

而其他参与者也会根据自身利益制定策略,双方需要在博弈中找到最优解,即双方都无法通过改变策略来获得更好的结果。

二、纳什讨价还价博弈模型的数学表达纳什讨价还价博弈模型可以用数学符号来表示。

假设有两个参与者,分别记作P1和P2,他们的讨价还价策略分别为x和y。

参与者的效用函数分别为U1(x,y)和U2(x,y)。

在纳什讨价还价博弈模型中,每个参与者的目标是最大化自己的效用函数。

P1的效用函数可以用如下形式表示:U1(x,y) = p1(x) - c(x,y)其中,p1(x)表示P1根据策略x所能获得的收益,c(x,y)表示为了达成协议而付出的代价。

同样地,P2的效用函数可以表示为:U2(x,y) = p2(y) - c(x,y)参与者P2的收益p2(y)和代价c(x,y)的定义与参与者P1类似。

参与者P1和P2的决策是相互影响的,通过博弈求得双方最优解,即纳什均衡。

三、纳什讨价还价博弈模型的实例为了更好地理解纳什讨价还价博弈模型,我们可以通过一个实际案例来进行分析。

假设有两个公司A和B在进行价格谈判,他们希望通过讨价还价策略来确定最终的交易价格。

公司A可以选择提出高价、低价或中等价位,记作x1、x2和x3。

公司B也可以做出相应的选择,记作y1、y2和y3。

纳什均衡

纳什均衡

纳什均衡,Nash equilibrium ,又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。

纳什均衡名称来源及简介:约翰·纳什1948年作为年轻数学博士生进入普林斯顿大学。

其研究成果见于题为《非合作博弈》(1950)的博士论文。

该博士论文导致了《n人博弈中的均衡点》(1950)和题为《非合作博弈》(1951)两篇论文的发表。

纳什在上述论文中,介绍了合作博弈与非合作博弈的区别。

他对非合作博弈的最重要贡献是阐明了包含任意人数局中人和任意偏好的一种通用解概念,也就是不限于两人零和博弈。

该解概念后来被称为纳什均衡。

假设有n个局中人参与博弈,给定其他人策略的条件下,每个局中人选择自己的最优策略(个人最优策略可能依赖于也可能不依赖于他人的战略),从而使自己利益最大化。

所有局中人策略构成一个策略组合(Strategy Profile)。

纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。

即在给定别人策略的情况下,没有人有足够理由打破这种均衡。

纳什均衡,从实质上说,是一种非合作博弈状态。

纳什均衡经典案例:囚徒困境1950年,数学家塔克任斯坦福大学客座教授,在给一些心理学家作讲演时,讲到两个囚犯的故事。

)假设有两个小偷A和B联合犯事、私入民宅被警察抓住。

警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果一个犯罪嫌疑人坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪。

如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑8年;如果另一个犯罪嫌人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。

如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。

表2.2给出了这个博弈的支付矩阵。

表2.2 囚徒困境博弈关于案例,显然最好的策略是双方都抵赖,结果是大家都只被判1年。

纳什均衡计算

纳什均衡计算

纳什均衡计算随着时代的发展,“纳什均衡”已经成为计算机理论和现实中很常用的概念。

本文将具体介绍一下“纳什均衡”。

自二战后,经济学家们开始对信息经济学感兴趣,到了六十年代初,经济学家们进入了一个黄金时代。

纳什提出并验证了均衡点概念( equilibrium point,亦称均衡状态),之后经济学家们通过严格的数学推导和计算,认识到了均衡点的重要性。

在八十年代后期,他们发现了新古典均衡模型,纳什也因此获得了诺贝尔经济学奖。

均衡点成了许多学者研究的重点。

由于我国对经济学界相关资料较少,无法对这些领域做深入研究,但通过近几年对经济学的了解,我总结出了一些“纳什均衡”。

下面是我的整理。

1。

一般均衡( Nash equilibrium)是指市场上的所有厂商都达到均衡状态。

任何一个厂商都可以调整自己的产量,不同厂商所调整的产量的差额就是市场价格。

一个事实是,这种最终均衡只能是一种理论假设,而不可能真正实现。

因为单个厂商根本没有办法调整其产量;同样地,任何一个厂商所做的改变,都会影响市场上所有其它厂商的产量,因而,要想让一个厂商达到一般均衡,那么所有厂商必须同时达到一般均衡。

在现实生活中,达到一般均衡的可能性是非常小的。

例如,在国际贸易领域中,大家都知道,两个国家在交换货物前要进行谈判,双方的谈判基础是彼此都有意愿出口,也都有意愿进口。

在这种情况下,双方都希望尽可能出高价,以便使自己的利益最大化。

一旦达成协议,双方就会迅速开始履行合同,并努力降低生产成本,使产品价格尽可能接近世界价格,避免发生贸易争端。

这时候,双方所达成的协议实际上是没有任何其它更好的选择的。

这种局面称为“一厢情愿”。

2。

局部均衡( Local equilibrium),或称部分均衡( Partial equilibrium),是指市场上的某些厂商达到均衡状态。

一个事实是,当某些厂商拥有较强的技术优势时,其它厂商为了避免与该厂商直接竞争,往往会与之形成专业化分工协作关系。

4 纳什均衡

4 纳什均衡


求解纳什均衡的反应函数法


当一个博弈可以用博弈矩阵表示出 来时,我们可以用划线法找出其纳什均 衡,但若一个博弈中参与人可选择的策 略有无穷多个,无法用博弈矩阵表示时, 要求出其纳什均衡,就要用到反应函数 法。 下面简要介绍库诺特寡头竞争模型 帮助大家理解反应函数法。
库诺特寡头竞争模型
关于风险厌恶的统计



究竟应取具有支付优势的NE还是取具有风险优 势的NE呢? 假设你是一个很穷的学生或者下岗职工,好不容 易在周末找了一个卖力气的工作。老板别出心裁的安 排了两种工资支付方式: 第一种:每天下班时领取100元; 第二种:由抛硬币决定你是领200元,还是一无 所得。 你会选择哪一种工资支付方式?(注:两种方式的期 望工资值相等)
假设:选民的政治态度从 0到 1排列,越往左代 表越支持劳工阶层,越往右代表越支持企业主 的利益。如下图所示:
民主党
0
· 1/2 3/4 · · 1/4
共和党
1
一个政党要想获胜,就要尽可能拉更多的 选民,因此与哪个政党所宣传的政治态度接近 的居民越多,哪个政党就获胜。


因此,我们会看到民主党会往右靠,宣布 他们也要照顾到中产阶级的利益,甚至兼顾企 业主发财;共和党也会向左靠,最终两党实际 纲领非常接近,这就是两党执政的稳定性。 (中庸之道与极端主义) 由于政客们在竞选时是怎样有利于拉选票 就怎样讲,当选就忘得一干二净,这就是两党 执政的欺骗性。
(2)商业中心区的形成



在城市街道上,我们常见到一些地 段上的商店十分拥挤,构成一个繁荣的 商业中心区,但另一些地段却十分冷僻, 没什么商店。对于这种现象,我们可以 运用杂货铺定位模型加以解释。 产品定位: 趋同化 差异化
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

纳什均衡模型
纳什均衡模型是博弈论的一种重要模型,它的理论构建和应用都令人深感兴奋。

纳什均衡(Nash Equilibrium)是指在博弈中,每个玩家都选择了其最佳策略,此时任何一个玩家的策略都不能提高其收益,即稳定状态。

纳什均衡模型是一个非合作博弈模型,从博弈中每一个玩家的利益出发考虑。

在纳什均衡模型中,博弈参与者面临多个选择,每个选择都有其对应的收益和代价。

每个玩家基于对其他玩家的策略和期望收益,选择其个人最优策略。

纳什均衡的本质是每位玩家都选择能够使自己最大收益的策略,同时不会因此造成其他玩家收益下降。

因此,纳什均衡具有共同稳定状态和极端稳定状态两个特点。

在纳什均衡模型中,每个玩家对于对手的决策做出合理的假设。

这意味着,每个玩家都认为其他玩家会选择可以让其获得最高利益的决策。

这样,每个玩家都在不确定其他玩家的选择前提下,做出最佳策略。

博弈论中常用的纳什均衡模型有几种类型,如对称博弈、阶段博弈、重复博弈等。

对称博弈是指博弈中各参与者间地位相同时,可以简单理解为大家在相同的起点上,比如说棋盘游戏中黑白双方。

阶段博弈是指博弈过程中存
在不同阶段,每个阶段的行动规则不同。

重复博弈是指博弈的过程是不断进行的,在每一轮博弈中,玩家可以选择是否与上一轮博弈中的对手继续博弈,可以选择不同的策略等。

在实际中,纳什均衡模型可以应用在很多领域,例如社会经济、政治决策、科技竞争、战争等。

一个经典的例子是普利斯顿市的纳什-库恩博弈(Nash-Kuon Game),这是一个典型的两人博弈模型。

这个博弈的两个玩家分别是出租车司机和乘客。

司机可以选择走哪一条路线,而乘客可以选择等待还是从另一家公司叫车。

假设司机选择途经一个拥堵路段,而乘客选择等待,那么司机的收益将被减少。

但如果其他司机也在选择少走一条路,那么对于司机来说,选择走这条路则是最佳决策。

此时,达成了纳什均衡。

总结:
纳什均衡模型的重要性在于,它提供了一种分析博弈行为的有效方法,不仅仅可以分析社会、经济等领域的竞争行为,同时还可以分析个人与个人之间的博弈行为。

然而,它也面临着时间复杂度高、在现实情况中难以应用等问题。

不过,随着技术的不断进步,纳什均衡模型的应用前景仍然十分广阔。

相关文档
最新文档