博弈论三大典型模型

合集下载

博弈论经典模型

博弈论经典模型经典的博弈模型来源于生活中的现象，很多都是来源于我们的日常生活，只要我们善于总结和发现我们也可以对发生在我们日常的现象进行归纳和总结。

下面是我对网上一些博弈论现象做一个总结：智猪博弈——搭好顺风车，借力成事；枪手博弈——对比关系及策略决定强弱；囚徒困境——个人理性与集体的非理性；斗鸡博弈——狭路相逢勇者未必胜；分蛋糕博弈——讨价还价的策略；以牙还牙——有一种智慧叫宽恕；鹰鸽博弈——路径依赖法则新解；蜈蚣博弈——从后往前的推理；猎鹿博弈——合作是硬道理；酒吧博弈——求同存异的智慧；鲇鱼效应——有竞争才有发展；重复博弈——冲突与合作方能共享；协和谬误——欲罢不能的错上加错；信息甄别——酒好不怕巷子深；人质困境——雪上加霜的囚徒困境；脏脸博弈——都是共同知识惹的祸；成本博弈——摆脱沉没成本羁绊的策略；手表定律——标准不同结论就不同；策略均衡——谁也不得罪。

1．智猪博弈在博弈论（Game Theory）经济学中，“智猪博弈”是一个著名的纳什均衡的例子。

假设猪圈里有一头大猪、一头小猪。

猪圈很长，一头有一踏板，另一头是饲料的出口和食槽。

猪每踩一下踏板，另一边就会有相当于10份的猪食进槽，但是踩踏板以后跑到食槽所需要付出的“劳动”，加起来要消耗相当于2份的猪食。

问题是踏板和食槽分置笼子的两端，如果有一只猪去踩踏板，另一只猪就有机会抢先吃到另一边落下的食物。

踩踏板的猪付出劳动跑到食槽的时候，坐享其成的另一头猪早已吃了不少。

“笼中猪”博弈的具体情况如下：如果两只猪同时踩踏板，同时跑向食槽，大猪吃进7份，得益5份，小猪吃进3份，实得1份；如果大猪踩踏板后跑向食槽，这时小猪抢先，吃进4份，实得4份，大猪吃进6份，付出2份，得益4份；如果大猪等待，小猪踩踏板，大猪先吃，吃进9份，得益9份，小猪吃进1份，但是付出了2份，实得-1份；如果双方都懒得动，所得都是0（做个博弈分析图表）。

利益分配格局决定两头猪的理性选择：小猪踩踏板只能吃到一份，不踩踏板反而能吃上4份。

聊聊四种经典的博弈论模型

聊聊四种经典的博弈论模型展开全文1、囚徒困境：为什么两个犯人都选择坐牢官差破获了一宗盗窃案，抓住了两名犯罪嫌疑人。

但在审讯过程中，被关在一处的二人始终矢口否认盗窃罪名，说东西不是我们偷的。

为了避免两人达成默契，结成攻守同盟，官差决定对他们进行单独审讯。

官差表示，如果两人中有一人坦白认罪，则可立即释放，另一个不认罪的人判5年徒刑；如果两人都坦白罪刑，则他们将各判2年徒刑。

但还有一种情况，那就是两个人都拒绝坦白，由于缺乏证据，他们只会以扰乱公共场合为名判处3个月拘役。

这就是两名罪犯面临的困境中，他们会做出怎样的选择呢？首先，他们互相之间都不清楚对方是否会坦白，其次，二人都希望将自己的刑期缩至最短。

如此考虑，最终，两名犯人都会选择坦白交代。

上面的案例就是博弈论所说的“囚徒困境”。

犯人们如果彼此合作，可为集体带来最佳利益（刑期最短）；但当二人面对同样的情况且不知道对方如何选择时，在理性思考后，双方都会得出相同的结论（坦白交代），以便达到个人利益的最大化。

囚徒困境是博弈论的“非零和博弈”中具代表性的例子，反映的是个人的最佳选择并非是团体的最佳选择。

虽然困境本身只属模型性质，但现实中的价格竞争、环境保护等方面，也会频繁出现类似情况。

2、智猪博弈：赢的总是小猪猪圈里有大小两头猪，它们在同一个食槽里进食。

为了保持饲料的新鲜，在远离猪食槽的另一边有一个踏板，大猪或小猪跑过去，每按动一次踏板，投食口就会掉落10个单位的食物。

于是，在大猪和小猪每次进食前，就会形成这样一种局面:如果小猪跑去按踏板，大猪守在食槽边，则大猪小猪吃到的食物比是9:1；反之，如果大猪去按而小猪守在食槽边，则吃食比例是6:4。

如果二猪同时到食槽边，则吃食比是7:3。

这样一来，从纯收益的角度考虑，小猪就更愿意选择在食槽边等待食物落出，因为“等待优于行动”，而大猪只能被迫奔忙在踏板和食槽之间。

上述“智猪博弈”的案例是经济学家的假设论证模型，这个博弈的结果，用经济学视角看待，可以解释为：谁占有更多资源，谁就必须承担更多义务。

博弈论究竟讲什么？一文读懂11种经典博弈论模型

博弈论究竟讲什么？一文读懂11种经典博弈论模型先说一个小故事：美国第34任总统艾森豪威尔，在他年轻的时候，有一次吃过晚饭后他跟家人一起玩纸牌，一连六盘，他拿到的都是最坏的牌。

于是他变得不高兴起来，嘴里开始不停地埋怨。

他的母亲停了下来，对他说道：“如果你要继续玩下去，就不要埋怨手中的牌怎么样。

不管怎样的牌发到手中，你都得拿着。

你唯一能做的就是尽你所能，打好手里的每一张牌，求得最好的结果。

”在城主的上一篇文章中，谈到了德鲁克在《创新与企业家精神》中提到的几种竞争战略，制定战略的过程是决策的过程，推进战略落地则是执行的过程。

无论是决策还是执行，其本质都是一次次博弈的组合。

那么，究竟什么是博弈？大到国与国之间的制衡，小到一个人的一生，博弈都是无处不在，无论是商业竞争中，还是日常工作中，生活中，甚至子女教育，两性爱情。

因为每个人都在时时刻刻想着与他人竞争，每时每刻都把自己放在局中人的位置上。

这就是俗话说的“人生如戏，戏如人生”，充分运用游戏规则，做好自己人生的演员，就是博弈思维能力的体现。

专门研究相互依赖、相互影响的人群，其理性决策行为及这些决策的均衡结果的理论，就是博弈论。

博弈是有技巧的，博弈论的主体则是规定的若干博弈模型，通俗的说就是人们常说的“套路”。

但博弈论是严肃的科学，如果有人非要像剥洋葱一样地剥开博弈思维，看看各种博弈技巧的核心是什么，那么他将会看到两个字——理性。

从博弈论衍生出来的博弈思维，体现了人的理性思维，也就是说我们的任何结果均是采取某种决策和行动的结果。

这体现了博弈思维奉行的“因果论”，正所谓“种瓜得瓜，种豆得豆”。

想要得到理想的结果，除了依靠我们的理性分析，采取正确的决策，并付诸行动外，别无他法。

正因为博弈思维是一种理性思维，所以冲动是魔鬼，更是博弈思维的大敌。

这里，我们要认清“理性”的几个误区。

1.理性的人一定是自利的，但世界上又有多少纯粹的“大公无私”呢？2.理性和道德不是一回事，在追求的自利的同时，产生出来的利他才有可能持久。

博弈论3-4经典动态博弈模型

3.4 几个经典动态博弈模型453.4.1 寡占的斯塔克博格模型46动态的寡头产量竞争博弈厂商1先选择，厂商2后选择。

21q q Q +=121111112)](8[)(q q q q q c Q P q u -+-=-=221222222)](8[)(q q q q q c Q P q u -+-=-=策略空间：[0，Q max ]中所有实数。

Q max 为不至于使价格降到亏本的最大限度的产量。

Q Q P P -==8)(价格函数：边际生产成本：无固定成本得益函数：221==c c 2121116q q q q u --=2221226q q q q u --=47两阶段动态博弈。

第一阶段，厂商1选择产量；第二阶段，厂商2选择产量。

1 、第二阶段厂商2的选择目标：得益最大化。

求使自己得益最大化下的产量值，即最大化时的一阶条件：得益函数：2221226q q q q u --=用逆推归纳法进行分析：02602122=--⇒=∂∂q q q u 112213)6(21q q q -=-=求出厂商2对厂商1产量的反应函数：48两阶段动态博弈。

第一阶段，厂商1选择产量；第二阶段，厂商2选择产量。

2 、第一阶段厂商1的选择。

用逆推归纳法进行分析：12213q q -=厂商1可直接求出使自己得益最大化时的产量：厂商1知道2的决策思路：直接将上式代入厂商1的得益函数，得到：2112111121*211*211213)213(66),(q q q q q q q q q q q q u -=---=--=3030*1*111=⇒=-⇒=∂∂q q q u厂商1的最佳产量是生产3单位。

将之代入厂商2的反应函数，得到厂商2的最佳产量5.15.13*2=-=q 此时市场价格为3.5，双方的得益别为4.5和2.25单位。

3*1=q 12213q q -=用逆推归纳法分析得出，该动态博弈的唯一的子博弈完美纳什均衡：厂商1在第一阶段生产3单位产量，厂商2第二阶段生产1.5单位产量。

十大经典博弈论模型

十大经典博弈论模型博弈论是一门研究决策者之间互动的学科，其应用范围广泛，涉及到经济、政治、生物学等领域。

在博弈论中，经典博弈论模型是基础和核心，以下是介绍十大经典博弈论模型：1. 囚徒困境博弈模型囚徒困境博弈模型是博弈论中最为著名的模型之一，也是最为典型的非合作博弈模型。

该模型主要讲述的是两个囚犯被抓后面临的选择问题，如果两个人都招供，那么都将受到较重的惩罚；如果两个人都不招供，那么都将受到轻微的惩罚；如果一个人招供而另一个人不招供，那么招供的人将受到宽大处理，而另一个人将受到较重的惩罚。

2. 零和博弈模型零和博弈模型是博弈论中最为简单的模型之一，其特点是参与者之间的利益完全相反，即一方获得利益就意味着另一方的利益受到损失。

在这种情况下，参与者之间的互动往往是竞争和对抗的。

3. 博弈树模型博弈树模型是一种用于描述博弈过程的图形模型，它可以清晰地展示出参与者在不同阶段的选择和决策，以及每个选择所带来的收益和风险。

4. 纳什均衡模型纳什均衡模型是博弈论中最为重要的概念之一，它指的是一个博弈中所有参与者都采取了最优策略的状态。

换句话说，如果所有参与者都遵循纳什均衡，那么任何一个人单方面改变策略都将无法获得更多的利益。

5. 最小最大化模型最小最大化模型是一种解决零和博弈问题的方法，其思想是在所有可能的情况中，选择让对手收益最小的情况，从而实现自己的最大化收益。

6. 帕累托最优解模型帕累托最优解模型是一种解决多人博弈问题的方法，其核心思想是通过合作和协商，使得所有参与者都能获得最大的收益，而不是只有某个人获得了最大的收益。

7. 博弈矩阵模型博弈矩阵模型是一种常用的博弈论分析工具，它可以清晰地展示出参与者在不同策略下的收益和风险，从而帮助参与者做出最优决策。

8. 拍卖模型拍卖模型是博弈论中的一个重要应用领域，其目的是通过竞价的方式，让参与者以最低的价格获得所需的商品或服务。

9. 逆向选择模型逆向选择模型是一种解决信息不对称问题的方法，其核心思想是通过知道对方的信息，来预测对方的行为和决策，从而做出最优策略。

博弈模型汇总

博弈模型汇总博弈模型是博弈论的重要工具，用于描述博弈参与者之间的策略和利益关系。

在博弈论中，通过建立合适的博弈模型，可以帮助我们分析和理解各种不同类型的博弈情境，并预测博弈参与者的行为和可能的结果。

下面将对几种常见的博弈模型进行汇总和介绍。

1. 零和博弈模型：零和博弈模型是博弈论中最简单和最基本的模型之一。

在零和博弈中，博弈参与者的利益完全相反，一方的利益的增加必然导致另一方的利益的减少。

这种博弈模型常常用于描述双方的冲突和竞争情境。

常见的零和博弈模型有二人零和博弈和多人零和博弈。

2. 非合作博弈模型：非合作博弈模型是博弈论中较为常见的模型之一。

在非合作博弈中，博弈参与者之间的行动和决策是相互独立的，每个博弈参与者都追求自身的最大利益。

在非合作博弈模型中，博弈参与者可以选择不同的策略，根据对手的行动做出最优的响应。

常见的非合作博弈模型有纳什均衡模型和博弈树模型。

3. 合作博弈模型：合作博弈模型是博弈论中另一个重要的模型。

在合作博弈中，博弈参与者之间可以进行协作和合作，共同追求最大化整体利益。

合作博弈模型通常用于描述多个博弈参与者之间的联盟和合作情境。

常见的合作博弈模型有核心模型和合作博弈解。

4. 演化博弈模型：演化博弈模型是博弈论中较为新颖和有趣的模型之一。

在演化博弈中，博弈参与者的行动和策略可以随时间变化和演化。

演化博弈模型通常用于描述博弈参与者之间的适应性和进化过程。

常见的演化博弈模型有进化博弈动力学模型和演化博弈解。

博弈模型的应用广泛，不仅在经济学中有重要的地位，也在其他学科领域得到广泛运用。

博弈模型可以帮助我们分析和解决各种决策和策略问题，对于理解社会、经济和生物系统中的行为和演化具有重要意义。

总结起来，博弈模型是博弈论的核心工具之一，用于描述和分析博弈参与者之间的策略和利益关系。

常见的博弈模型包括零和博弈模型、非合作博弈模型、合作博弈模型和演化博弈模型。

这些模型在各个领域中都有广泛的应用，对于理解和解决各种决策和策略问题具有重要意义。

博弈论的几个经典模型

模型二、囚徒困境/非合作博弈
囚徒困境可以用来说明许多现象。
寡头定价拍卖出价推销员的努力政治上的讨价还价军备竞赛等（冲突中出现两败俱伤的情况,
往往要考虑到囚徒困境）
*（纯策略）纳什均衡
问题与思考
• 什么是博弈论？试举两个你生活中的例子说明。
• 某年在荷兰召开了一次“合作及社会两难困境研讨会”，与会者都是博弈论的专家。
基本术语
• 博弈涉及哪些内容呢？
博弈涉及至少两个独立的博弈参与者 (player)。
博弈涉及行动者存在着策略（strategy）选择的可能，博弈论用策略空间来表示参与者可以选择的策略。
参与者在不同策略组合下会得到一定的支付（payoff）。
对于博弈参与者来说，存在着一博弈结果。
对于游戏设计者，这是一个最好的
模型二、囚徒困境/非合作博弈
在博弈论中，含有占优战略均衡的一个著名例子是由塔克给出的“囚徒困境” （prisoners’dilemma）博弈模型。该模型用一种特别的方式为我们讲述了一个警察与小偷的故事。
模型二、囚徒困境/非合作博假设：有两个小偷A弈和B联合犯事、私入
第四章博弈论的几个经典模型
讲授人谭建国
引言
博弈论又被称为对策论（ Game Theory)，按照2005年因对博弈论的贡献而获得诺贝尔经济学奖的Robert Aumann 教授的说法，博弈论就是研究互动决策的理论。所谓互动决策，即各行动方（即局中人[player]）的决策是相互影响的，每个人在决策的时候必须将他人的决策纳入自己的决策考虑之中，当然也需要把别人对于自己的考虑也要纳入考虑之中……在如此迭代考虑情形进行决

博弈论中的三个经济学模型

q1* = q2*= (a-c) /3 此时， u1*=u2*=（a-c)2 /9
考虑关系式：qi*= (a-c-qj*) /2 无论qj是否最优，由 qi= (a-c-qj) /2决定的qi总是厂商i针对厂商j产出水平的最优反应；我们称关系式qi= (a-c-qj) /2为厂商i针对厂商j的策略的反应函数，并记为：qi*= Ri(qj)= (a-c-qj) /2.由此 NE（ qi* ， qj* ）必须是方程组： q1= (a-c-q2) /2 q2= (a-c-q1) /2 的解。-------------------------反应函数法
q2 a-c
R1(q2) =(a-c- q2)/2
(a-c)/2 (a-c)/3 NE R2(q1)=(a-c- q1)/2 (a-c) 3 q1
0
(a-c) 2
a-c
（二）Bertrand Model of Duopoly
*两厂商决策的相互影响在于需求函数 Di(pi ,pj)=a- pi +b pj 两厂商的产品具有一定的差异性；b是厂商i 的产品对厂商j的产品的替代系数。 ●标准式表述 1、参与人：厂商1与厂商2；他们生产同类但存在一定差异的产品。
2、他们选择价格，Si={pi： pi≥0}； 3、他们的支付函数就是他们的利润函数： ui= ui(pi,pj) 假定两厂商 =Di(pi ,pj) pi - Di(pi ,pj) c 均无固定成本，只有常数边际 =(a- pi +b pj) (pi-c) 成本c。厂商i的反应函数： a+c+bpj Ri(pj) = 2
Max ui(qi ，qj*) =Max [-q 2 +(a-c-q *)q ] i j i qi∈Si qi∈Si

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

博弈论三大典型模型
1.囚徒困境
“囚徒困境”说的是两个囚犯的故事。

这两个囚徒一起做坏事，结果被警察发现抓了起来，分别关在两个独立的不能互通信息的牢房里进行审讯。

在这种情形下，两个囚犯都可以做出自己的选择：或者供出他的同伙，或者保持沉默。

这两个囚犯都知道，如果他俩都能保持沉默的话，就都会被释放，因为只要他们拒不承认，警方无法给他们定罪。

但警方也明白这一点，所以他们就给了这两个囚犯一点儿刺激：如果他们中的一个人背叛，即告发他的同伙，那么他就可以被无罪释放，同时还可以得到一笔奖金。

而他的同伙就会被按照最重的罪来判决，并且为了加重惩罚，还要对他施以罚款，作为对告发者的奖赏。

当然，如果这两个囚犯互相背叛的话，两个人都会被按照最重的罪来判决，谁也不会得到奖赏。

那么，这两个囚犯该怎么办呢？是选择互相合作还是互相背叛？从表面上看，他们应该互相合作，保持沉默，因为这样他们俩都能得到最好的结果：自由。

但他们不得不仔细考虑对方可能采取什么选择。

A犯不是个傻子，他马上意识到，他根本无法相信他的同伙不会向警方提供对他不利的证据，然后带着一笔丰厚的奖赏出狱而去，让他独自坐牢。

这种想法的诱惑力实在太大了。

但他也意识到，他的同伙也不是傻子，也会这样来设想他。

所以A犯的结论是，唯一理性的选择就是背叛同伙，把一切都告诉警方，因为如果他的同伙笨得只会保持沉默，那么他就会是那个带奖出狱的幸运者了。

而如果他的同伙也根
据这个逻辑向警方交代了，那么，A犯反正也得服刑，起码他不必在这之上再被罚款。

所以其结果就是，这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应：坐牢。

企业在信息化过程中需要与咨询企业、软件供应商打交道的。

在与这些企业打交道的过程中，我们不可避免地也会遇到类似的两难境地，这个时候需要相互之间有足够的了解与信任，没有起码的信任做基础，切不可贸然合作。

在对对方有了足够的信任之后，诚意也是必不可少的，如果没有诚意或者太过贪婪，就可能闹到双方都没有好处的糟糕情况，造成企业之间的双输。

2. 智猪博弈
在博弈论（Game Theory）经济学中，“智猪博弈”是一个著名的纳什均衡的例子。

假设猪圈里有一头大猪、一头小猪。

猪圈的一头有猪食槽，另一头安装着控制猪食供应的按钮，按一下按钮会有10个单位的猪食进槽，但是谁按按钮就会首先付出2个单位的成本，若大猪先到槽边，大小猪吃到食物的收益比是9∶1；同时到槽边，收益比是7∶3；小猪先到槽边，收益比是6∶4。

那么，在两头猪都有智慧的前提下，最终结果是小猪选择等待。

实际上小猪选择等待，让大猪去按控制按钮，而自己选择“坐船”(或称为搭便车)的原因很简单：在大猪选择行动的前提下，小猪也行动的话，小猪可得到1个单位的纯收益(吃到3个单位食品的同时也耗费2个单位的成本，以下纯收益计算相同)，而小猪等待的话，则可以获得4个单位的纯收益，等待优于行动；在大猪选择等待的前提
下，小猪如果行动的话，小猪的收入将不抵成本，纯收益为-1单位，如果小猪也选择等待的话，那么小猪的收益为零，成本也为零，总之，等待还是要优于行动。

在小企业经营中，学会如何“搭便车”是一个精明的职业经理人最为基本的素质。

在某些时候，如果能够注意等待，让其他大的企业首先开发市场，是一种明智的选择。

这时候有所不为才能有所为！
高明的管理者善于利用各种有利的条件来为自己服务。

“搭便车”实际上是提供给职业经理人面对每一项花费的另一种选择，对它的留意和研究可以给企业节省很多不必要的费用，从而使企业的管理和发展走上一个新的台阶。

这种现象在经济生活中十分常见，却很少为小企业的经理人所熟识。

3.斗鸡博弈
两只斗鸡在决斗的时候，无论选择进或退都是一个难题，因为纳什均衡已经给出了一胜一败的最优策略。

在很多较量下，死拼将是得不偿失的，因为很可能给第三者机会。

因此，两个已经在战场的强势力很可能自觉的遵循纳什均衡，当一方攻击时，另一方暂退。

虽然可能某方暂时受损，但较之于两败俱伤是好得多的。

不过，要维持这一状况，必须保证下一次先期受损的一方发动攻势的时候，另一方同样的后退。

于是这样的攻击性行为开始变得“仪式化”，没有人真正流血。

这只不过是两个巨头玩弄的游戏，目的是警告后来者，想进来，那么也得陪我们一起玩，可是你玩的起么？。