经典博弈模型

合集下载

博弈论“囚徒困境”的四种形式

博弈论“囚徒困境”的四种形式

博弈论中的“囚徒困境”摘要:“囚徒困境”模型是博弈论中的经典范例,它是1950年Tucker提出的,其完全信息下的静态博弈为广大博弈论的工作者和初学者所掌握,成为解释生活现象的有力工具。

其实“囚徒困境”模型随着博弈论的深入发展,具有各种不同的形式,通常分为:完全信息的静态博弈,完全信息的动态博弈,不完全信息的静态博弈及不完全信息的动态博弈四种形式。

本文将对“囚徒困境”的这四种形式作一个简单的介绍和分析。

关键词:博弈论囚徒困境经济一、完全信息静态“囚徒困境”博弈完全信息静态“囚徒困境”博弈部分地奠定了非合作博弈论的理论基础。

它的基本模型是:警察抓住了两个合伙犯罪的罪犯,由于缺乏足够的证据指证他们的罪行,所以希望这两人中至少有一人供认犯罪,就能确认罪名成立。

为此警察将这两个罪犯分别关押以防止他们串供,并告诉他们警方的政策是“坦白从宽,抗拒从严”:如果两人中只有一人坦白认罪,则坦白者立即释放,而另一人则将重判5年徒刑;如果两个同时坦白认罪,则他们将各判3年监禁。

当然罪犯知道如果他们两人都拒不认罪,则警方只能以较轻的妨碍公务罪判处他们1 年徒刑。

用矩阵表示两个罪犯的得益如下(得益向量的第一个数字是囚徒1的得益,第二个数字是囚徒2的得益) :囚徒2囚徒1(表1)假定两个罪犯熟悉彼此,这便是一个同时行动的完全信息静态博弈。

容易看出,由于对于每个囚徒而言,无论对方选择什么策略,坦白都是自己的最优策略,所以(坦白,坦白) 是博弈的Nash均衡。

二、完全信息动态“囚徒困境”博弈——重复“囚徒困境”博弈研究重复博弈的意义在于基本博弈会重复进行,比如犯罪团伙会被警方多次审讯,日常生活中买卖会重复进行,国际间的战争此伏彼起。

而且人们也发现基本博弈的重复进行并非基本博弈的简单累加,比如商业中的回头客问题。

下面继续以表1所示的“囚徒困境”模型为例对多重博弈进行探讨。

首先观察“囚徒困境”的有限博弈,以T记基本博弈的重复次数。

协调博弈经典例子

协调博弈经典例子

协调博弈经典例子
协调博弈是一种游戏理论,它允许两个或多个玩家之间的公平博弈。

它是运用数学和经济学定义最佳博弈策略以及最佳合作策略,来帮助判决者在不同情况下对抗敌人或合作伙伴时决定正确行动。

协调博弈的应用范围很广,它可以帮助我们更好地理解如何在竞争和合作中达成共识。

经典的协调博弈模型,包括合作者模型,通常用于研究多个玩家之间的行为,例如买方和卖方之间的市场价格泡沫,这种模型也会反映出多个个体之间是否愿意合作共享利益,而不是为了自己的益处独占。

另一个经典的协调博弈模型是《非零和博弈》,它涉及两个智者面对某种威胁,例如战争和其他威胁,以避免最糟糕的结果,即把所有人都拖入毁灭和混乱的境地。

在这种博弈中,玩家有自己的利益冲突,他们必须做出最佳决定,考虑到对方的可能行为、以及双方可能的最终结果。

另一种经典的协调博弈模型是搭积木游戏,也称为“操作者的挑战”。

在这种游戏中,两个操作者在一起玩游戏,他们必须利用像棒子、牌子这样的工具,创造出一个结构。

有时,这些结构可能会依赖一方的工具,而不是另一方的工具。

因此,两个玩家必须尽量保持同步,确保他们的分工平衡,以避免因不平衡而导致游戏失败。

最后,还有一个经典的协调博弈模型是《出租车定价》,在这个模型中,两个出租车司机都要有一个共同的利益:在一定的时间内,尽最大可能提高他们的收入。

但是,它们也存在着利益冲突:司机A 可能想要抢占某一个客户,但是司机B也想要抢占这个客户,因为这将使司机A收入下降。

因此,他们必须想出一个令两个司机都比较满意的价格定价方案,以确保两个司机都能获得最大的利益。

经典的就业市场信号博弈模型_博弈论与信息经济学--PBL教程_[共4页]

经典的就业市场信号博弈模型_博弈论与信息经济学--PBL教程_[共4页]

123第5章

不完全信息动态博弈

传递博弈模型中的典型——就业市场信号博弈模型,就是我们一个很好的研究对象。虽然它主要是分析劳动就业市场上教育(可看成是一种信息)所起的信号作用,但是,只要能够明白其中的作用机制,那么就能把同样的分析思路应用在经济领域的其他方面。

5.3.2 经典的就业市场信号博弈模型

下面我们研究一个简单的就业市场信号博弈模型。 假设在市场上,有一个雇主(用R表示)和求职者(用S表示)。对于求职者来说,他有两种可能的类型,高能力和低能力,我们用H表示高能力,L表示低能力,有T={H, L}。求职者知道自己所属的类型而雇主并不知道,也就是说求职者的类型是求职者的私人

信息。雇主知道求职者属于高能力的先验概率为μ( H )=1–q,属于低能力的先验概率为μ(L)=q。由于雇主不能直接观测到求职者的能力,因此雇主只能通过某些与求职者相关的

信号来对求职者所属的类型(能力的高低)进行判断。这里我们假设求职者的受教育程度e是求职者所发出的与其类型相关的信号,而雇主的最优回应是给出一个相应的工资水平

w。因为求职者的受教育程度与其能力相关,我们可以假设能力高的人获得同等教育程度的

成本要小于能力低的人,这是斯彭斯就业市场信号博弈模型的一个重要假设,显然该假设也是合理的。即 ce(L, e)> ce(H, e)

其中,ce(t, e)表示类型为t、教育水平为e的求职者进一步接受教育的边际成本。根据

这一假定,如果能力高和能力低的求职者分别付出努力达到相同的教育程度,那么,作为对其花费在提高教育程度上的成本的补偿所获得的工资w,低能力求职者所要求的最低工资

(至少能弥补付出成本的报酬)水平明显要高于高能力求职者的要求。受教育水平越高,显然需要更高的工资来弥补付出的成本。由于低能力求职者要获得更高的教育程度需要付出更多的努力,于是会要求工资增加得更多一些,才足以弥补他所付出的心血。这里我们把受教育程度解释为相同学历的学生在学校表现的差异,而不是受教育的时间年限。如果受教育程度表现为受教育的年限,那么这个博弈会变成一个蜈蚣博弈,因为每一年求职者都会选择是继续上学还是工作:如果选择工作,该博弈结束;如果选择继续上学,那么博弈进行到下一个阶段。 为了分析的方便,我们假设该劳动市场是一个完全竞争市场,因而雇主提供的工资水平是一个期望值,为()()(,)()(,)μwe=μHeyHe+μLeyLe××。其中,μ(He)表示雇主认为教育

基于“斗鸡博弈”模型的实例分析与启示

基于“斗鸡博弈”模型的实例分析与启示

基于“斗鸡博弈”模型的实例分析与启示斗鸡博弈是一种博弈论中经典的模型,它曾被用来解释产业竞争、政治冲突等各种社会现象。

在这个模型中,两只“鸡”分别代表着两位决策者,它们需要在“逃避博弈”和“斗争博弈”之间做出选择。

这个模型虽然看似简单,但却能够从博弈者的决策行为中揭示出不少有趣的现象和启示。

在本文中,我们将通过一个实例分析来展示斗鸡博弈模型的应用,并探讨其中的一些启示。

假设有两个农场主同时养了一只公鸡,并且它们住在彼此相邻的地方。

它们每天早上都会让自己的公鸡在田野中觅食,而公鸡之间的距离越近,它们之间的争斗就越不可避免。

如果两只公鸡相遇,它们就会立刻展开激烈的斗争,这将耗费它们的大量体力和时间。

不过,如果某只公鸡在看见对方时选择了逃避,那么它们就能各自平安地觅食并享受生活。

在这个场景中,两位农场主就需要在“逃避博弈”和“斗争博弈”之间做出选择。

当公鸡之间的距离较近时,农场主们会面临一个决策问题:是让自己的公鸡继续寻找食物,还是立刻将它叫回来以避免可能的争斗?这涉及到一个博弈问题:如果一方选择逃避,而另一方选择斗争,那么选择斗争的一方将能够占据更多的资源;但如果双方都选择逃避,它们便能避免争斗,从而节省体力和时间。

现在,让我们来看看这个实例中有哪些值得探讨的启示。

斗鸡博弈模型揭示了博弈者的决策会受到对手决策的影响。

在前述的实例中,每位农场主的决策都受到对方决策的影响。

如果一位农场主判断对方会选择斗争,那么他可能会选择逃避来避免受到损失;反之亦然。

这种相互影响的决策模式称为“对称博弈”,在这种博弈中,博弈者的利益与对手的决策密切相关。

斗鸡博弈模型还揭示了合作与竞争的博弈特性。

在这个模型中,两只公鸡之间的斗争代表着竞争,而它们选择逃避则代表了一种合作。

竞争和合作是社会中普遍存在的两种行为模式,它们在博弈过程中常常交织在一起。

在现实生活中,人们也需要在合作与竞争之间做出选择,这与斗鸡博弈模型的情境是有些类似的。

博弈论经典例子(27)智猪博弈

博弈论经典例子(27)智猪博弈

“智猪博弈”有许多应用,它可以解释为什么占有更多资源者必须承担更多的义务。

“智猪博弈”是一个著名的博弈论模型。

笼子里有两头猪,一头大猪,一头小猪。

笼子很长,头有一个按钮,另一头是饲料的出口和食槽。

按一下按钮,将有相当于10份的猪食进槽,但是按按钮以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。

问题是按钮和食槽分置笼子的两端,按按钮的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。

如果大猪先到,大猪呼啦啦吃到9份,小猪只能吃到1份。

如果同时到达,大猪吃到7份,小猪吃到3份。

如果小猪先到,小猪司以吃到4份,而大猪吃到6份。

“智猪博弈”的具体情况如下:如果两只猪同时按按钮,同时跑向食槽,大猪吃进7份,得益5份。

小猪吃进3份,实得1份;如果大猪按按钮后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份.得益4份;如果大猪等待,小猪按按钮,大猪先吃,吃进9份,得益9份,小猪吃进l 份,但是付出了2份,实得-l份;如果双方都懒得动,所得都是0。

比较以上数字,我们知道“等待”是小猪的优势策略,“按按钮”是小猪的劣势策略。

现在来看大猪。

由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待,1份不得;按按钮,得到4份。

所以“等待”就变成了大猪的劣势策略(注意,是现在才变成劣势策略)。

因此就得到“智猪博弈”的结局:小猪将选择“搭便车”的策略,也就是舒舒服服地等在食槽边;而大猪则会不知疲倦地奔忙于按钮和食槽之间,小猪只是坐享其成地等待,每次都是大猪去按按,小猪先吃,大猪再赶来吃。

“智猪博弈”有许多应用,它可以解释为什么占有更多资源者必须承担更多的义务。

欧佩克的一个重要特点是其成员的生产能力各不相同。

沙特阿拉伯的生产能力远远超出共他成员。

同属一个同盟的大成员和小成员,他们的作弊激励是不是一样大?为了简化这个问题,我们只看一个小成员,即科威特。

假定在合作的情况下,科威特应该每天生产100万桶石油,沙特阿拉伯则生产400万桶。

(完整word版)经典的博弈论分析案例——“海盗分金”问题

(完整word版)经典的博弈论分析案例——“海盗分金”问题

经典的博弈论分析案例——“海盗分金”问题5个海盗抢得100枚金币,他们按抽签的顺序依次提方案:首先由1号提出分配方案,然后5人表决,超过半数同意方案才被通过,否则他将被扔入大海喂鲨鱼,依此类推。

“海盗分金”其实是一个高度简化和抽象的模型,体现了博弈的思想。

在“海盗分金”模型中,任何“分配者”想让自己的方案获得通过的关键是事先考虑清楚“挑战者”的分配方案是什么,并用最小的代价获取最大收益,拉拢“挑战者”分配方案中最不得意的人们。

假设前提假定“每个海盗都是绝顶聪明且很理智”,那么“第一个海盗提出怎样的分配方案才能够使自己的收益最大化?”推理过程从后向前推,如果1至3号强盗都喂了鲨鱼,只剩4号和5号的话,5号一定投反对票让4号喂鲨鱼,以独吞全部金币。

所以,4号惟有支持3号才能保命。

3号知道这一点,就会提出(100,0,0)的分配方案,对4号、5号一毛不拔而将全部金币归为已有,因为他知道4号一无所获但还是会投赞成票,再加上自己一票,他的方案即可通过。

不过,2号推知3号的方案,就会提出(98,0,1,1)的方案,即放弃3号,而给予4号和5号各一枚金币。

由于该方案对于4号和5号来说比在3号分配时更为有利,他们将支持他而不希望他出局而由3号来分配。

这样,2号将拿走98枚金币。

同样,2号的方案也会被1号所洞悉,1号并将提出(97,0,1,2,0)或(97,0,1,0,2)的方案,即放弃2号,而给3号一枚金币,同时给4号(或5号)2枚金币。

由于1号的这一方案对于3号和4号(或5号)来说,相比2号分配时更优,他们将投1号的赞成票,再加上1号自己的票,1号的方案可获通过,97枚金币可轻松落入囊中。

这无疑是1号能够获取最大收益的方案了!答案是:1号强盗分给3号1枚金币,分给4号或5号强盗2枚,自己独得97枚。

分配方案可写成(97,0,1,2,0)或(97,0,1,0,2)。

分析1号看起来最有可能喂鲨鱼,但他牢牢地把握住先发优势,结果不但消除了死亡威胁,还收益最大。

博弈论中的经典模型和SG函数

博弈论中的经典模型和SG函数

博弈论中的经典模型和SG函数章节涉及1. 巴什博弈2. 威佐夫博弈3. Nim博弈4. 斐波那契博弈5. SG函数注:本章只给出结论,证明可出门度娘巴什博弈 (Bash Game)A和B⼀块报数,每⼈每次报最少 a 个,最多报 b 个,看谁先报到 n 。

这是最古⽼的巴什博奕游戏。

结论:如果n≡0(mod a+b) ,那么后⼿必胜,否则先⼿必胜。

威佐夫博弈 (Wythoff Game)有两堆各若⼲的物品,两⼈轮流从其中⼀堆取⾄少⼀件物品,⾄多不限,或从两堆中同时取相同件物品,规定最后取完者胜利。

结论:假如⼀开始两堆的物品为 a , b ( a < b )那么如果⌊(b−a)×w⌋=a,(w=√5+12)=1.618 先⼿必输,否则必胜(注意精度).尼姆博弈(Nim Game)有任意堆物品,每堆物品的个数是任意的,双⽅轮流从中取物品,每⼀次只能从⼀堆物品中取部分或全部物品,最少取⼀件,取到最后⼀件物品的⼈获胜。

结论:把每堆物品数全部异或起来,如果得到的值为0,那么先⼿必败,否则先⼿必胜。

斐波那契博弈(fibonacci Game)有 n 个物品,两⼈轮流取物品,先⼿最少取⼀个,⾄多⽆上限,但不能把物品取完,之后每次取的物品数不能超过上⼀次取的物品数的⼆倍且⾄少为⼀件,取⾛最后⼀件物品的⼈获胜。

结论:先⼿胜当且仅当 n 不是斐波那契数SG 函数有向图游戏:给定⼀个有向⽆环图,图中有⼀个唯⼀的起点,在起点上放⼀个棋⼦。

两名玩家交替的把这枚棋⼦向有向边移,每次可以移动移动⼀步,⽆法移动者为负。

该游戏被称为有向图游戏,任何⼀个公平组合游戏都可以转换为有向图游戏。

具体⽅法是,把每个局⾯看成图中的⼀个节点,并且从每个局⾯向沿着合法⾏动能够到达的下⼀个局⾯连有向边.Mex运算设 S 表⽰⼀个⾮负整数集合。

定义 mex(S) 为求出不属于集合S的最⼩⾮负整数数.SG函数在有向图游戏中,对于每个节点 x ,SG(x)=mex({ SG(y1) , SG(y2) .....}) ,其中y为x的后继节点。

14-动态博弈经典模型1详解

14-动态博弈经典模型1详解

厂商A 先决定产量 q1,
厂商B根据厂商A的行为再决定产量 q2, 厂商A在决策时会考虑厂商B的反应。


求解方法: Backward induction
第二阶段厂商B的最优选择:
max 2 (q1, q2 ) q2 (120 q1 q2 )
2 (q1 , q2 ) 120 q1 2q2 0 q2 q ,q ) * 1 12 120 q 2q 0 FOC:q2 ( (120 q1 )1 2 2 q2 2 q1为厂商A在第一阶 * 1 q2 (120 q1 ) 2 段的实际产量选择
例题2



斯塔伯格均衡求解
假设
市场的需求函数为: Q=a-P
反需求函数为: 边际成本 : P=a-Q=a-q1-q2 AC1= AC2=MC1=MC2=c
厂商A先决定产量 q1 厂商B根据厂商A的行为再决定 q2

ห้องสมุดไป่ตู้
厂商的利润函数为:
1 (q1 , q2 ) q1[ P(Q) MC ] q1 (a q1 q2 c) 1 (q1 , q2 ) q1[ P(Q) MC ] q1 (a q1 q2 c) 2 (q1 , q2 ) q2 [ P(Q) MC ] q2 (a q1 q2 c) 2 (q1 , q2 ) q2 [ P(Q) MC ] q2 (a q1 q2 c)
max 1 (q1 , q2* ) q1 (a q1 q2* c)
1 其中: q2 2 (a q1 c)
*
即:
max 1 (q1 , q ) q1[a q1 1 (a q1 c) c] 2
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。


+1,-1
-∞,-∞
收益:(苏联,美国)
经典模型六:小偷与守卫

一小偷欲偷窃有一守卫看守的仓库。如 果小偷偷窃时守卫在睡觉,则小偷收益 为V;如果小偷偷窃时守卫没有睡觉, 则小偷被抓收益为-P。如果守卫睡觉小 偷得手则守卫收益为-D;如果守卫睡觉 而小偷未偷,则守卫收益为S。除这些 情况外,则守卫与小偷都无得也无失。 则小偷与守卫的博奕如下图。
守卫


不睡
V,-D 0,S
-P,0 0,0
小偷 不偷

为了免于失盗,当局加大对小偷的惩罚 还是加大对守卫失职的惩罚?
经典模型七:猎鹿模型

两个猎人打猎。如果单兵作战,则只能 打到4只兔子,价值为4;如果两人合作, 可以猎获1只鹿,各分得价值为10个单 位;但猎人单独猎不到鹿。两位猎人合 作吗?
猎人乙 鹿 鹿 猎人甲 兔
10,10
0,4

4,0
4,4
收益:(猎人甲,猎人乙)

作为猎人中的一位,你的选择是?策略 是?
经典模型八:店铺定址博弈

有一个沿公路均匀居住的村庄,现有两 家店铺在该村庄开张,他们所售商品相 同,价格相同。两家店开在什么地方?A B Nhomakorabea0
1/4
1/2
3/4
1
女孩
足球
足球 男 音乐
音乐
2,1
0,0
0,0
1,2
收益:(男,女)


为了能做自己喜欢的事,男孩和女孩如 何做? 例:供应链上的合作关系
经典模型四:斗鸡博弈


在美国,一些飞车党党徒为了表示勇敢, 通常由两个人分别驾驶两辆车急速对撞。 因怕死而让道的一方被称为小鸡,在飞 车党内备受歧视;而不让道的一方在飞 车党内备受推崇。 如果两人都不让道,不死即残,收益为w;如果让道,受大家嘲笑,收益为-10; 如果不让道,受大家尊敬,收益为+10。 让道还是不让道?

坦白
坦白 -5,-5
抵赖
0,-8 -1,-1

抵赖
-8,0
收益:(甲,乙)

对甲乙各方,最好的选择是?对甲乙双方, 最好的选择是? 甲乙最终的选择是? 若不隔离,双方选择是?



囚徒困境的稳定解是(-5,-5) 个人理性≠团体理性,个人最优≠团体最 优 现实例子: 彩电/VCD大战,垄头企业的联合,国际 石油联盟
小猪



5,1 9,-1
4,4 0,0
大猪

收益:(大猪,小猪)


大猪按,小猪选择等待 例:大企业进行新产品的研究开发及市场的 开拓,而小企业则选择模仿及跟随;大股东与 小股东对公司经营的监督选择等
经典模型三:情侣博弈

一对年青的情侣,男孩喜欢足球赛,女 孩喜欢欣赏音乐会。某一天,同时有一 场特别重要的足球赛和一场女孩期待已 久的音乐会。如果一起去看足球赛,则 男孩收益2,女孩1;一起去欣赏音乐会, 则女孩收益2,男孩收益1。否则,收益 均为0。请问:看足球赛还是欣赏音乐 会?
第一章 经典博弈模型



经典模型一:囚徒困境 经典模型二:智猪博弈 经典模型三:情侣博弈 经典模型四:斗鸡博弈 经典模型五:鸽?鹰? 经典模型六:小偷与守卫 经典模型七:猎鹿博弈 经典模型八:店铺定址
经典模型一:囚徒困境

某地发生一起严重的仓库纵火案。警察 在现场抓住两个嫌疑犯,是他们为报复 放火烧仓库。但警方没有足够证据。警 察把两个嫌疑犯隔离囚禁,并说明如果 他们承认纵火,每人判五年;如果他们 都不坦白,以妨碍公务罪各判一年;如 果一个承认而另一个不承认,则承认者 宽大释放,另一个判8年。
经典模型二:智猪博弈
猪圈里有一大一小两头猪,猪圈的一侧有 个猪食槽,另一侧有一个控制食槽的按 钮。按一下按钮会有10单位的猪食进槽。 谁按按钮需付2个单位成本。若小猪先 到,则大猪吃到6单位,小猪吃到4个单 位;若大猪先到,则大猪吃到9个单位, 小猪吃到1个单位;若两猪同时到,大 猪吃到7单位,小猪吃到3个单位。问: 大猪和小猪,谁会去按按钮?
党徒2

党徒1

让 -10,-10 -10,+10 撞 +10,-10
-w,-w
收益:(党徒1,党徒2)

作为党徒之一,是撞还是让?
经典模型五:鸽?鹰?

苏联和美国是冷战时代的两个超级大国, 长期处于对抗状态。两国各有妥协(鸽) 和强硬(鹰)两种路线。其收益如下:
美国 鸽 鸽 苏联 鹰
0,0
-1,+1
相关文档
最新文档