纳什博弈论案例
博弈论纳什均衡及其改进

消防监督管理的必要性及措施: 针对以上问题,唯一的解决方法就是国家政府部门通 过加强经济手段为主的消防监督管理以及颁布、完善 相关的政策、法律法规来促进企业主动加强消防安全 投入。 首先,公安消防部门要加大消防检查处罚及信息 披露宣传力度。消防部门的经济处罚是依法实施消防 监督的重要措施和手段,是消防监督执法工作的一个 重要环节。消防部门在对企业进行处罚的同时,要加 强宣传力度,对消防安全不符合的企业,不仅要向社 会报道对其依法惩处的情况,而且还要向社会宣传企 业存在的火灾隐患以及由此可能引发的危害。
纳什均衡案例及其改进
案例一:消防安全投入博弈及其改进方法
企业的消防安全投入是企业固定生产成本的组成部分,它 意味着在为企业和社会带来效益的同时所花费的代价。作为 追求利润最大化的企业,如何确定自身的最优消防投入,也 是很值得研究的。下面我们首先从竞争企业消防安全投入决 策来进行分析。
• 假设市场上仅有甲乙两家竞争企业,两个企业的雇主和 雇员均乐于建立安全的工作环境,两个企业同样面临两种选 择:安全或不安全。 • 即使企业和职工双方均希望有安全的生产环境,会进行 消防安全投入,但是由于市场竞争更为紧迫时,企业鉴于担 心经营失败或由于利润的诱惑,则会出现不同的情况。
最后,应进一步建立健全各项消防法律、 法规。健全消防法规,增强对企业消防安 全投入行为的约束,是强化企业消防安全 投入的一个重要方面。因此,应根据市场 经济的规律,按照依法行政原则,进一步 建立健全各项消防法律、法规,通过制度 建设,切实把消防监督管理方式由传统的 权力导向型转为法律、规则导向型,坚持 依法行政,严格依法和依规则办事。
改变方案二:增量方案。 投食为原来的一倍分量。结果是小猪、大猪都 会去踩踏板。谁想吃,谁就会去踩踏板。反正 对方不会一次把食物吃完。小猪和大猪相当于 生活在物质相对丰富的“共产主义”社会,所 以竞争意识却不会很强。
好的纳什均衡例子(一)

好的纳什均衡例子(一)好的纳什均衡什么是纳什均衡?纳什均衡是博弈论中的一个重要概念,指的是在博弈参与者之间形成的一种稳定和平衡的策略选择状态。
在纳什均衡下,任何一个参与者都无法通过改变自己的策略来获得更大的利益。
好的纳什均衡指的是存在多个纳什均衡时,其中某些纳什均衡比其他纳什均衡更为理想。
例子一:囚徒困境囚徒困境是博弈论中最经典的例子之一。
假设有两个犯人,他们因为涉嫌合谋犯罪被捕,警察只有有限的证据。
警察与每个犯人分别进行单独审讯,并给他们提供了合作和背叛两个选项,这两个选项对应于认罪和抵赖。
如果两个人都选择合作,即认罪,则每个人都会被判刑2年;如果两个人都选择背叛,即抵赖,则每个人都会被判刑5年;如果一个人选择合作而另一个选择背叛,则合作的人会被判刑6年,而背叛的人会被判刑1年。
在这个案例中,存在两个纳什均衡:互相背叛和互相合作。
然而,互相合作是更为理想的纳什均衡,因为如果两个人都选择合作,他们的总刑期将会最短,只有2年。
例子二:拍卖拍卖是另一个常见的博弈场景。
假设有两个竞拍者A和B,他们在一个拍卖会上竞价购买一件物品。
物品的最低价格为100元。
竞拍者A知道他的估值是200元,而竞拍者B知道他的估值是150元。
他们每次可以按照一定幅度加价,但不能超过自己的估值。
在这个案例中,存在两个纳什均衡:A出价200元,B不出价;B 出价150元,A不出价。
然而,对于卖家来说,A出价200元,B不出价是更好的纳什均衡,因为这样卖家可以以更高的价格售出物品。
例子三:价格战价格战是市场竞争中常见的博弈情景。
假设有两家公司A和B,它们在同一个市场上销售类似的产品。
它们可以根据自己的利润目标制定价格。
如果两家公司的价格相等,则它们将平分市场份额;如果一家公司的价格比另一家低,则它将获得更大的市场份额。
在这个案例中,存在两个纳什均衡:价格相等和一家公司的价格低于另一家。
然而,价格相等是更好的纳什均衡,因为这样两家公司可以共享更多的市场份额,并且避免因为价格战而导致的利润下降。
博弈论66个经典例子(9)不会令人后悔的纳什均衡

不会令人后悔的均衡在纳什均衡中,你不一定满意其他的策略,但你的策略是回馈对手招数的最佳策略。
从囚徒困境中我们会发现,作为博弈各方的行动就是针对对方行动而确定的最佳对策,而一旦知道对方在做什么,就没人愿意改变自己的做法。
博弈论学把这么一个结果称为均衡。
这个概念是有普林斯顿大学数学家约翰·纳什提出的,因此被称为纳什均衡。
诺贝尔经济学奖获得者萨缪尔森有句名言,你可以将一只鹦鹉训练成经济学家,因为它所需要学习的只有两个词,供给与需求。
博弈论专家坎多瑞引申说:“要成为现代经济学家,这只鹦鹉必须再多学一个词,这个词就是纳什均衡”。
1950年,还是一名研究生的纳什写了一篇论文,题为《n人博弈的均衡问题》,该文只有短短一页纸,可就这短短一页纸成了博弈论的经典文献。
纳什的贡献是,他证明了在这一类的竞争中,在很广泛的条件下是有稳定解存在的,只要是别人的行为确定下来,竞争者就可以有最佳的策略。
那么,什么纳什均衡呢?简单说,就是一策略组合中,所有的参与者面临这样的一种情况:给定你的策略,我的策略是我最好的策略。
给定我的策略,你的策略也是你最好的策略,即双方在对方给定的策略下不愿意调整自己的策略。
纳什均衡从此成为经济学家用来分析商业竞争到贸易谈判现象的有力工具,所以纳什均衡是对冯诺依曼和摩根斯坦的合作博弈论的重大发展,甚至说是一场革命。
纳什均衡首先对亚当斯密“看不见的手”的原理提出挑战,按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果,从纳什均衡引出一个悖论:从利己的目的触发,结果损人不利己。
“囚徒困境”就是如此,从这个意义说,纳什均衡提出的悖论实际上动摇了西方经济学的基石。
纳什的想法成为我们指导“同时行动博弈”的最后一个法则的基础。
这个法则如下:走完寻找优势策略和剔除劣势策略的捷径之后,下一步就是寻找这个博弈的均衡。
所谓博弈均衡,它是一稳定的博弈结果。
均衡是博弈的一结果,但不是说博弈的结果都能成为均衡。
纳什讨价还价博弈模型与实例

纳什讨价还价博弈模型与实例在经济学中,博弈论是研究决策制定和策略选择的重要理论工具。
纳什讨价还价博弈模型是博弈论中的一种典型模型,用于分析参与者在讨价还价过程中的策略选择和效用最大化问题。
本文将介绍纳什讨价还价博弈模型的基本概念和数学表达,并结合实际案例进行解析。
一、纳什讨价还价博弈模型的基本概念纳什讨价还价博弈模型是由约翰·纳什提出的,用于分析多方参与者在讨价还价过程中的策略选择和达成协议的问题。
在博弈模型中,每个参与者都会追求自己的最大化利益,通过制定合适的策略来达到目标。
在讨价还价过程中,参与者可以选择不同的策略,例如提出高价、低价或中等价位,以实现自己的利益最大化。
而其他参与者也会根据自身利益制定策略,双方需要在博弈中找到最优解,即双方都无法通过改变策略来获得更好的结果。
二、纳什讨价还价博弈模型的数学表达纳什讨价还价博弈模型可以用数学符号来表示。
假设有两个参与者,分别记作P1和P2,他们的讨价还价策略分别为x和y。
参与者的效用函数分别为U1(x,y)和U2(x,y)。
在纳什讨价还价博弈模型中,每个参与者的目标是最大化自己的效用函数。
P1的效用函数可以用如下形式表示:U1(x,y) = p1(x) - c(x,y)其中,p1(x)表示P1根据策略x所能获得的收益,c(x,y)表示为了达成协议而付出的代价。
同样地,P2的效用函数可以表示为:U2(x,y) = p2(y) - c(x,y)参与者P2的收益p2(y)和代价c(x,y)的定义与参与者P1类似。
参与者P1和P2的决策是相互影响的,通过博弈求得双方最优解,即纳什均衡。
三、纳什讨价还价博弈模型的实例为了更好地理解纳什讨价还价博弈模型,我们可以通过一个实际案例来进行分析。
假设有两个公司A和B在进行价格谈判,他们希望通过讨价还价策略来确定最终的交易价格。
公司A可以选择提出高价、低价或中等价位,记作x1、x2和x3。
公司B也可以做出相应的选择,记作y1、y2和y3。
三方博弈纳什均衡例题

三方博弈纳什均衡例题全文共四篇示例,供读者参考第一篇示例:三方博弈是博弈论中一种常见的情形,指的是有三方参与并且彼此之间存在竞争和合作关系的博弈情况。
纳什均衡是博弈论中的一个重要概念,指的是在博弈中每个玩家都做出最佳决策的情况下所达到的一个稳定状态。
在三方博弈中,如果存在某种情况下所有玩家都无法通过改变自身策略而获益,这种状态就是三方博弈的纳什均衡。
下面我们通过一个例子来说明三方博弈纳什均衡的概念。
假设有三位学生A、B、C参加了一个考试竞赛,在这个竞赛中,他们可以选择合作作弊,也可以选择正当的考试。
如果三位学生都选择正当考试,那么每个人都能得到10分的成绩;如果某一位学生作弊而其他两人选择正当考试,那么作弊的学生可以得到15分,而其他两人得0分;如果所有人都选择作弊,那么每个人只能得到5分。
同理,对于学生B和C来说,选择作弊也是更有利的策略。
第二篇示例:三方博弈是博弈论中的一个重要概念,指的是有三个各自独立的决策者同时做出决策的情况。
在三方博弈中,每个决策者都会考虑其他两方的利益和行为,以最大化自己的利益。
纳什均衡是博弈论中一个非常重要的概念,是指在一个博弈当中,每个参与者都选择了最优的行动策略,没有任何一方可以通过改变自己的策略来获得更好的结果。
下面我们来看一个关于三方博弈纳什均衡的例题。
假设有三个玩家A、B、C,他们在一个零和博弈中,并且每个玩家都只有两种可行的策略,分别是合作和背叛。
博弈的收益矩阵如下表所示:| | 合作| 背叛|| ---- | ------ | ------ || 合作| 3,3,3 | 1,4,4 || 背叛| 4,4,1 | 0,2,2 |在这个收益矩阵中,每个元素表示每个玩家在不同组合下的收益,例如当A、B、C都选择合作时,他们的收益分别是3,当A、B、C都选择背叛时,他们的收益分别是2。
现在我们来分析一下这个博弈的纳什均衡。
我们来看一下玩家A的最佳策略。
玩家A会根据其他两个玩家的策略来选择自己的策略,如果B、C都选择合作,那么玩家A选择背叛可以得到更高的收益4;如果B、C都选择背叛,那么玩家A也选择背叛可以得到更高的收益4。
博弈论经典案例

博弈论经典案例1. 囚徒困境:这是一种经典的博弈论案例,两名囚犯被关押在不同的牢房中,警方缺乏确凿的证据将他们定罪,决定让他们进行交涉。
如果两人都认罪,每人将会被判刑5年;如果一个人认罪而另一个人保持沉默,认罪的人将会被判刑1年,而保持沉默的人将被判无期徒刑;如果两人都保持沉默,每人将被判刑3年。
在这种情况下,每个囚犯都面临着是否信任对方合作的决策。
2. 麦氏定理:这是美国经济学家约翰·N·纳什于1950年提出的经典问题。
假设有两家咖啡店A和B,它们的位置一个在城市的北边,另一个在南边。
两家咖啡店需要决定每天早上的开门时间。
如果A咖啡店在北边开门,而B咖啡店在南边也同样开门,北部居民会去A店,南部居民会去B店,两家店的收入会平均分。
但是,如果A店在北边开门,而B店在南边关门,南部居民不得不去北边排队等待,这将导致北边的队伍变长,北部居民也会选择去B店。
麦氏定理指出,当两家店选择不同的开门时间时,总是有一种策略,使得两家店的收入之和最大。
3. 社交圈中的追逐游戏:在一个社交聚会上,一对情侣分手后,男方试图追回女方。
男方完成了一连串的行动,女方必须在每个行动之后做出回应。
游戏的目标是让女方接受男方的求爱。
这个案例涉及到博弈论中的策略选择和不确定性。
4. 价格竞争:在一场市场竞争中,两家公司决定销售产品的价格。
低价通常会吸引更多的消费者,但是公司也需要考虑到自己的成本和利润。
每家公司需要在出售产品的定价上权衡竞争和利润之间的平衡。
这个案例涉及到博弈论中的纳什均衡和即时反应策略。
5. 投标博弈:在一场拍卖中,多个竞争者竞相出价,以获得拍卖品。
每个竞争者必须决定自己的出价,以获得最大的利润。
这个案例涉及到博弈论中的最优出价和风险评估。
纳什讨价还价博弈模型与实例

纳什讨价还价博弈模型与实例纳什讨价还价博弈模型是博弈论中常用的一种模型,它被广泛应用于经济学、管理学等领域,用于分析博弈双方在讨价还价过程中的策略选择和最终达成的协议。
本文将从基本概念、模型规定和一个实际案例等方面逐步回答相关问题,全面解读纳什讨价还价博弈模型。
一、基本概念纳什讨价还价博弈模型是由美国数学家约翰·福布斯·纳什提出的,它是博弈论中的一个重要分支。
在讨价还价博弈中,至少有两个参与方,他们在进行讨价还价的过程中,会根据对方的策略进行选择,以期达成对自身最有利的协议。
讨价还价博弈模型适用于许多实际情境,比如企业与供应商之间的谈判、员工与雇主之间的薪资谈判等。
二、模型规定在纳什讨价还价博弈模型中,假设有两个参与方A和B,他们在讨价还价的过程中,需要先各自提出一个预期值,然后根据对方的预期值和自身的预期值进行策略选择。
具体而言,假设A和B的预期值分别为a和b,那么a和b可以是一个数值或者一个区间。
在博弈的每一轮中,A和B需要分别作出策略选择,即提出一个讨价方案。
这个方案可以是两个预期值的平均值、某个参考值周围的某个比例、前一轮讨价结果上下浮动的某个比例等。
双方的策略选择会对协议的最终结果产生重要的影响。
三、一个实际案例为了更好地理解纳什讨价还价博弈模型的应用,我们可以以一家电子产品公司与一个供应商之间的谈判过程为例。
假设该电子产品公司希望从供应商处购买更低廉的零件,并打算与供应商进行协商。
首先,双方需要确定自己的预期值。
假设该公司认为合理的价格范围为每单位零件100-150美元,供应商认为合理的价格范围为每单位零件120-160美元。
然后,在博弈的每一轮中,双方需要采取策略来提出讨价方案。
假设电子产品公司首先提出100美元,供应商提出120美元。
在下一轮中,公司可能选择提出110美元,供应商可能选择提出130美元。
双方的策略选择会受到对方提出的讨价方案以及自身预期值的影响。
精选最新生活中纳什均衡例子

首先我们先简单看一下纳什均衡的经济学含义:所谓纳什均衡,指的是参与人的这样一种策略组合,在该策略组合上,任何参与人单独改变策略都不会得到好处。
换句话说,如果在一个策略组合上,当所有其他人都不改变策略时,没有人会改变自己的策略,则该策略组合就是一个纳什均衡。
大家可以现有一个简单的印象,结合下面的案例再回来看这个定义。
案例一、智猪博弈猪圈里有两头猪,一头大猪,一头小猪。
猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。
如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。
当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。
那么,两只猪各会采取什么策略?答案是:小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。
原因何在?因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。
对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。
反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲力亲为了。
案例二、囚徒困境(1950年,数学家塔克任斯坦福大学客座教授,在给一些心理学家作讲演时,讲到两个囚犯的故事。
)假设有两个小偷A和B联合犯事、私入民宅被警察抓住。
警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果一个犯罪嫌疑人坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪。
如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑8年;如果另一个犯罪嫌人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。
如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。
囚徒困境博弈A╲B坦白抵赖坦白-8,-80,-10抵赖-10,0-1,-1关于案例,显然最好的策略是双方都抵赖,结果是大家都只被判1年。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
故事模型
A、B、C三人决斗,每人有2颗子弹,每次发一枪。
A、B、C的命中概率分别为0.3、0.8、1.0。
三人依次发射,两轮后对决结束。 每次可以选择向对手发射,也可以放空枪。 射中即死。 问在这场博弈中A的最优策略。
纳什均衡是指在对手策略既定的情况下,各自对局者所选择 的策略都是最好的。
合作是有利的“利己策略”。但它必须符合以下黄金律: 按照你愿意别人对你的方式来对别人,但只有他们也按同 样方式行事才行。也就是中国人说的“己所不欲勿施于 人”。但前提是人所不欲勿施于我。 其次,“纳什均衡”是一种非合作博弈均衡,在现实中 非合作的情况要比合作情况普遍。
上策均衡与纳什均衡的区别: ⑴ 上策均衡是指不管你选择什么策略,我所选择的 是最好的;不管我选择什么策略,你所选择的是最好 的。 ⑵ 纳什均衡是指给定你的策略,我所选择的是最好 的;给定我的策略,你所选择的是最好的。 ⑶ 上策均衡是纳什均衡的一种特殊情况,但纳什均 衡却不一定是上策均衡。
纳什均衡的意义
三国中的博弈-孙刘联盟的瓦解
可是从对策论来看,孙权却犯了一个大错误,由于
嫉妒,他过早和刘备翻脸,致使两败俱伤。这就好 比枪手A突然翻脸向B开火。坐收渔利的当然是C。 虽然曹操的继任者曹丕没能抓住机会夹攻孙权,一 举消灭这两个敌手,但蜀和吴此后已经没有可能打 败魏国了。 那么,孙权的最优策略是什么?回想上面的枪 手决斗就明白了。既然已经落到A的地位,就该以A 的策略行事。让刘备去和曹操恶斗,自己扩充势力, 养精蓄锐,随机应变。无论两者胜负,自己都能从 中渔利。
假如你正在和朋友用手机通电话, 突然信号断了。这时,你会立即拨电 话过去,还是等你的朋友拨电话过来? 很显然,你是否应拨电话过去,取决 于你的朋友是否会拨过来。如果你们其中 一方要拨,那么另一方最好是等待;如果 一方等待,那么另一方就最好是拨过去。 因为如果双方都拨,那么就会出现线路忙; 如果双方都等待,那么时间就会在等待中 流逝。
三国中的博弈-孙刘联盟的瓦解
如果分析一下孙权的心理,我们可能对他的背信弃
义有更多同情。赤壁之战尽管符合他的利益,但到 底是他出力挽救了刘备,此后他不但把荆州长期借 给刘备,还把妹妹嫁给了这个老头子。他尽了同盟 的义务,曾与曹操大战数次,不仅损兵折将(他的大 将太史慈、董袭、陈武等都在战斗中阵亡),他自己 也险些在逍遥津送命。可从收益上说,他与刘备是 “牛打江山马坐殿”,感到不平衡是正常的。
A可以采取的行动
对空发射: 存活概率为0.8×(0.3+0.7×0.2)+0.2×0.3=41.2%
向C发射: 存活概率为 0.3×0.2×(0.7+0.3×0.2)+0.7×41.2%=33.4% 向B发射: 存活概率为0.7×41.2%=28.84%
再说三个枪手
A和B似乎达成了某种默契:在C被干掉之前,他们相
博弈论研究对象
博弈论是研究理性的决策主体在其行为发生直接的相 互作用时的策略选择及策略均衡的理论。
博弈分析的关键步骤是找出在别人选择既定的情况 下自己的最优反应策略(给自己带来最大收益的策略)。
冲突、竞争现象的定量分析理论。
参加竞争的各方为了获胜而需研究出 一组对付对方的策略。
博弈论的产生和发展
行动:局中人在特定条件下的行为 支付 ( Pay-off ):博弈结束时,各方得到的收益。 策略均衡:参与者之间稳定的、可预测的互动行 为模式,就是策略均衡。
上策均衡: 我所做的是不管你做什么我所能做的最好的 你所做的是不管我做什么你所能做的最好的
NASH均衡: 我所做的是给定你所做的我所能做的最好的 你所做的是给定我所做的你所能做的最好的
从孙子兵法到三十六计 从田忌赛马到孙庞斗智 从运筹帷幄到韬光养晦 从曹刿论战到论持久战
2. 博弈论的开山之作
1943 年,冯·诺依曼 和摩根斯顿发表《博 弈论和经济行为》的 一书, 标志着博弈论作为一门独立科学的开始, 也标志着新古典经济学进入了一个新的发 展阶段。
二、基本概念
1. 局中人或参与者(Players) 2. 规则( rules ):规定博弈各方的行动顺序、
(1)我国古代围棋、国际象棋(印度)等; (2)1912年,数学家翟墨罗把对策从模拟模型抽象 为数学模型; (3)第一次、第二次世界大战,军事对策应用于战 役和战略研究; (4)1944年,冯·诺意曼、摩根斯特合写了“博弈 论和经济行为”,推动了博弈论在经济管理中的应 用; (5)近年来,由于纳什、泽尔腾、海萨尼获诺贝尔 经济学奖(1994),进一步推动了博弈论的研究。
*在一场博弈中,你必须考虑对方的选择以确定你自己 的最优选择,而对方也必须考虑你的选择来确定他的 最优选择。 *你从博弈中得到的,不仅取决于你自己的行动,也取 决于对方的行动。 如果你知道恋人不会打过来(如以前断线就是她在 等电话,如果你的手机包月额度很难用完而她的接听免 费),那么你的最优行动就是拨过去。 *博弈最本质的特征是:双方的行动相互影响又相互依赖
三国中的博弈-孙刘联盟的瓦解
孙权不但“火烧赤壁”打败曹操,更在此后 还长期承担了对抗曹操的主要任务。而刘备虽在 赤壁之战中也出了力,但此后几年未与曹操打过 大仗(也就是没有尽联盟义务)。倒是趁此机会扫 荡地方势力,扩充地盘,直至占据两川,将曹操 赶出汉中,又派关羽北伐,水淹七军,不但取代 了孙权原来的老二地位,甚至有可能击败曹操, 成为新的老大。孙权地位跌落到老三,他的策略 也随之改变。 于是孙权趁关羽北伐后方空虚之机,与曹操 合谋,夺取了荆州,杀死关羽。结果是同盟破裂, 刘备兴兵报仇,又被孙权打败。蜀汉从此衰落, 东吴也面临了两面作战的不利局面。
B(80%) C(100%) A:30%
分析过程
A的行动选择集合(1)对空发射,(2)射B,(3)射C
如A对空发射, B有80%的可能杀死C(B必然射C,因为C一定选择射击B,则B必死);然 后A有30%可能杀死B(仅A,B;A必射B);如未能杀死B,则B向A射击 (A存活概率0.2)。对局结束。存活概率为0.8*(0.3+0.7*0.2)=0.352。 如B未射死C,则C射杀B,然后A要么成功射杀C,要么被C射杀;存活概率 为0.2*0.3=0.06。总体存活概率41.2%。 A射死B 概率树工具 0.3 B射死C 0.8 A未射死B B射A不中 A射空 0.7 0.2 B未射死C A射死C 0.2 0.3 A未射死C 0.7 C射A不中 0
0,0 1,-1
-1,1
0,0
0,0 -1,1
博弈论之“数学”的特征
只是数学思维、数学符号,有些符号怪模怪样,甚至
不会读,但很少有什么艰深的数学 这里的符号比较麻烦,因为它和代数中的纯粹抽 象而无意义的符号不同,在脑子里要时刻记得它 们的实际意义 但要熟悉这种简捷、抽象的思维方式,记住这些 符号的代表意义 所以,一个比较有效的学习方法是重复
互不是敌人。 这不难理解,毕竟人总要优先考虑对付最大的 威胁,同时这个威胁还为他们找到了共同利益,联 手打倒这个人,他们的生存机会都上升。而且,从 悲观的角度看,他们恐怕也活不到需要相互拼个你 死我活的时候。 但这个“同盟”也是很不牢固的,两个人都在 时时权衡利弊,一旦背叛的好处大于默契的好处, 他们马上就会翻脸。
方式、以及最终的结果等。
3. 策略( Strategy ) : 一整套的行动方案,规定
了各种情况下的行动。比如:敌进我退,敌退 我追,敌驻我扰,敌疲我打。
4.
相机策略( contingent strategy ):仅在不确定 事件发生时才会采取的策略。如:人不犯我,我
不犯人;人若犯我,我必犯人。
5. ”
一个对他人利益不构成威胁的人,自然不会是他人意欲除掉 的对象,反而能在各种政治风云中幸存下来。 能力最强,本事最大的人,反而最有可能走向悲剧结果。 C的存活概率只有14%。 能力处于中间状态的,是最可能存活的。B:56%
能力最弱的,也可以比最强者有更大的生存机会。A:41.2%。
博弈论简介
+ 博弈论(Game Theory)又名对策论,游戏论
–
–
–
博弈论,英文为Game theory,是研究相互依赖、相互影响的决 策主体的理性决策行为以及这些决策的均衡结果的理论。 博弈论试图研究既存在冲突又存在合作的情况下(如寡头垄断) 人们的决策行为。博弈是一种势态,在该势态中,两个或更多的 参与人都在追求他们各自的利益,没有人能够支配结果。 博弈的过程就是一个策略上的相互作用过程。这使得任何一方的 行为都必须考虑到对方可能作出的反映。
博弈论的产生和发展
1. 博弈在中国 《学弈》(《孟子•告 子》) :弈秋,通国之善 弈也。使弈秋侮二人弈, 其一人专心致志,惟弈秋 之为听;一人虽听之,一 心以为有鸿鹄将至,思援 弓缴而射之 。虽与之俱学 , 弗若之矣。为是其智弗若 与?吾曰:非然也。
博弈又称博戏,是一门古老的游戏。《世 本》说,“乌曹作博”,乌曹乃是夏代著 名之能工巧匠。千百年来,博弈更是与人 们的生活紧紧相连,从博棋到牌戏,从斗 戏到彩票,中华民族的历史长河中就这样 形 成 了 别 具 风 情 的 博 弈 文 化
上策与上策均衡
所谓上策,是指这样一种策略,即不管对手采取 什么策略,这种策略都是最优的。
而当对局者选择的都是上策的时候, 这种均衡叫做上策均衡 所谓均衡是指一种稳定的结局,当这种结局 出现的时候,所有的对局者都不想再改变他 们所选择的策略。
纳什均衡
纳什均衡是指在对手策略既定的情况下, 各自对局者所选择的策略都是最好的。
博弈论 及经典案例
+ 比赛规则:马按奔跑的速度分为上中下三等,
等次不同装饰不同,各家的马依等次比赛,三 赛二胜。 + 比赛前田忌按照孙膑的主意,第一场,用上等 马鞍将下等马装饰起来,冒充上等马, 与齐威 王的上等马比赛;第二场,用上等马与齐威王 的中等马比赛;第三场,田忌的中等马和齐威 王的下等马比赛。结果二比一,田忌赢了齐威 王。 + 在双方条件相当时,对策得当可以战胜对方; 在双方条件相差很远时,对策得当也可将损失 减低到最低程度。