2 完全信息静态博弈

合集下载

第2章_完全信息静态博弈

第2章_完全信息静态博弈


前行
退让
前行
(-10,-10) (20,-2)

退让
(-2,20) (0,0)
❖ (甲前行、乙退让)和(甲退让、乙前行)都是“斗鸡博弈” 的纳什均衡。
3.“市场争夺战”博弈
❖ 假设在市场中有两个竞争对手。一个是已经在市场中的“在位者”, 另一个是企图进入市场的“潜在进入者”。
❖ 潜在进入者有两个可以选择的策略:进入、不进入。在位者也有两个 可以选择的策略:斗争、默许。
(10,1) (2,2)
❖ 如果嫌疑人乙选择坦白,那么嫌疑人甲应该如何选择? ❖ 理性的嫌疑人甲会选择坦白。 ❖ 在嫌疑人甲选择坦白所对应的收益“5”的下方划一道短横线。 ❖ 类似可分析其他情况
❖ 2.通过“划横线法”求解“智猪博弈”的均衡
大猪
按开关 等待
小猪
按开关
等待
(5,-1)
(4,2)
(10,-2) (0,0)
❖ 如果大猪和小猪都去按压开关,然后两头猪从开关处奔向猪圈 另一端的盛食槽。由于大猪跑的快,小猪跑得慢,因此大猪会 比小猪早到达盛食槽并把盛食槽内的食物吃光。小猪付出了按 压开关的劳动却没有吃到食物。在此种情况下,大猪的收益为 5,小猪的收益为 -1。
❖ 如果大猪去按压开关,小猪在盛食槽旁等待。那么当大猪按下 开关后,盛食槽内出现食物,小猪立即开始吃,大猪则需要花 一定时间从猪圈一端跑到另一端。当大猪到达盛食槽后,身强 力壮的大猪会把小猪挤到一旁,吃光剩余的食物。在这种情况 下,大猪得到的收益是 4,小猪得到的收益是 2。
❖ 将嫌疑人甲标识在支付矩阵左侧,将嫌疑人乙标识在支付 矩阵上方 。
❖ 嫌疑人甲有两个策略可以选择:坦白、不坦白。将嫌疑人 甲可能的策略纵向排列在博弈支付矩阵左侧。

第二章完全信息静态博弈

第二章完全信息静态博弈

第二章完全信息静态博弈2在完全信息静态博弈中,各博弈方同时决策,且所有博弈方对各方得益都完全了解。

完全信息静态博弈属于非合作博弈最基本类型。

本章介绍该类博弈的一般分析方法、纳什均衡概念及分析方法的扩展。

2.1 基本分析方法3上策均衡严格下策反复消去法划线法箭头法上策均衡4 (Dominant-strategy Equilibrium)上策(Dominant-strategy) :不管其它博弈方选择什么策略,一个博弈方的某个策略给他带来的得益至少不低于其他策略。

例:囚徒困境Idea..?5上策均衡与均衡结果:上策均衡(坦白,坦白)均衡得益(-5,-5)“坦白”相对于“抵赖”是每个囚徒的上策(优势策略)-5,-50,-8-8,0-1,-1坦白抵赖坦白抵赖囚徒B囚徒A上策均衡6 (Dominant-strategy Equilibrium)上策均衡:由每个博弈方的上策所组成的策略组合。

一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策,必然是该博弈比较稳定的结果。

博弈方2博弈方1A B C a3,22,35,4 b2,11,23,3 c1,61,44,5例寻找上策(优势策略)检查一下你是否存在上策,如果有,就选择它。

站在其他方的位置上思考问题如果你没有上策,那么从其他博弈方角度考虑。

如果其他博弈方有上策,预期他将选择自己的上策。

严格下策:不管其它博弈方的策略如何变化,某种策略给一个博弈方带来的得益总比另一种策略小,称前一种策略为相对于后一种策略的“严格下策”。

1,01,30,40,2左中1,01,3左中1,01,30,10,40,22,0左中右上下211,3中上例:巡逻6,24,48,00,0巡逻不巡逻穷人不巡逻富人WELCOME富人与穷人1112处于强势的博弈方为维护自己利益采取某种决策时,为其他弱势博弈方提供了搭便车的机会公司里的大股东与小股东每一个博弈方针对其他方的每一种策略,在自己的最大可能得益下划线2,10,00,01,3时装足球时装足球丈夫妻子夫妻之争划线法13划线法:通过在最佳对策得益下划线分析博弈的方法。

应用博弈论第二讲完全信息静态博弈

应用博弈论第二讲完全信息静态博弈
33
2.2.1 纳什均衡的定义
策略空间:S1 , S n
博弈方 i的第 j 个策略:si j Si 博弈方 i的得益:u i
博弈:G {S1,Sn;u1,un}
纳什均衡:在博弈G {S1,Sn;u1,un}中,如果由各个博弈方i
的各一个策略组成的某个策略组合(si*,sn* ) 中,任一博弈方 的策略,都是对其余博弈方策略的组合 (si*,si*1, si*1,...sn* ) 的最佳对策,也即ui (si*,si*1, si*, si*1,...sn*) ui (si*,si*1, sij , si*1,...sn*)
岗位职责三工作总结项目运维项目实施银青高速视频监控东毛隧道停车场项目全面实施ip设置贵州独平高速项目全面实施监控室机柜布线四心得体会在这段时间的学习过程中我对部门很多产品从零学起刚到公司的时候感觉压力很大经过这些时间的认真学习和实际操作调整心态现已完全能融入公司的各项岗位职责和管理制度中
第二章 完全信息静态博弈
25
表1 划线法分析囚徒困境
囚徒 2

不招
囚 招 -8,-8 0,-10
徒 1
不 招
-10,0
-1,-1
26
习题3:划线法(一)
矩阵1
妻子
丈 活着 夫 死了
活着
1,1 0,-1
死了
-1,0 0,0
27
矩阵1的含义
矩阵1的纳什均衡为(活着,活 着)和(死了,死了)。这两个纳什均 衡的含义是这对夫妻要么同时活着,要 么同时死,如果有一个死了,则另一个 也宁愿选择死,而不愿单独活着。这说 明这对夫妻的感情极度恩爱,以至于单 独活着只有痛苦,甚至生不如死。
经开始对日本和德国这两个法西斯轴心国展开大反 攻。

第2讲 完全信息静态博弈【博弈论经典】

第2讲 完全信息静态博弈【博弈论经典】

第2讲 完全信息静态博弈

囚徒困境在经济学上有着广泛的应用。 例1:两个寡头企业选择产量的博弈。如果两个企业联合起来形成卡特尔,选择垄 断利润最大化的产量,每个企业都可以得到更多的利润。但卡特尔不是一个稳定 的均衡,因为给定对方遵守协议的情况下,每个企业都想增加生产,结果是,每 个企业都只得到小于最大利润的产量,利润严格小于卡特尔产量下的利润。 在有些情况下,个人理性和集体理性的冲突对社会来说也许是一件好事,尽管对 集体而言是一件坏事。
第2讲 完全信息静态博弈
下继续生活下去。 从囚徒困境中,我们可以引出一个很重要的结论:一种制度(体制)安排,要发 生效力,必须是一种均衡。否则,这种制度安排不能成立。
第2讲 完全信息静态博弈

3.重复剔除的占优均衡 在每个参与人都有占优战略的情况下,占优战略均衡是一个非常合理的预测,但在 绝大数博弈中,占优战略均衡是不存在的。
第2讲 完全信息静态博弈

在“智猪博弈”中,我们先剔除掉小猪的劣战略“按”,在剔除掉这个战略后的 新的博弈中,小猪只有一个战略“等待”,大猪仍有两个战略,但此时,“等待” 已成为大猪的劣战略,提出这个战略,剩下的唯一战略组合是(按,等待)。
第2讲 完全信息静态博弈

我们需要对“占优战略”和“劣战略”的概念进行重新定义。


都是(相对于si*的)劣战略。 在应用重复剔除方法寻找均衡时,一个战略是占优战略或劣 战略可能是相对于另一个特定的战略而言的。
第2讲 完全信息静态博弈
' ' ' 定义:令si 和s? 是参与人 i 可选择的两个战略(即 s i i Si, ' s’ i Si)。如果对于任意的其他参与人的战略组合s -i,参与人 ' ' i的选择si 得到的支付严格小于从选择s? i 得到的支付,即:

第二讲 完全信息静态博弈

第二讲 完全信息静态博弈

得每个参与人的策略是对其他
参与人策略的最优反应。


在纳什均衡点上,每一个理性 的参与者都不会有单独改变策略的冲动 均衡不一定是博弈的最优结果
19
纳什均衡
2.3 博弈的解和纳什均衡
纳什均衡定义: 在博弈 G S1,..., Sn ; u1,..., un 中,
* * 如果策略组合 ( s1 ,...sn )
中任一博弈方i的策略
* si* 都是对其余博弈方的策略组合 (s1* ,..., si*1, si*1,..., sn )
的最佳对策,也即
ui (s ,..., s , si , s ,..., s ) ui (s ,..., s , sij , s ,..., s )
* 1 * i 1 * * i 1 * n * 1 * i 1 * i 1 * n
* i

命题2.1 在n个博弈方的博弈 G S1,..., Sn ; u1,..., un 中,如 * * 果严格下策反复消去法排除了 (s1 ,..., sn ) 以外的所有策略组 * * ,..., sn ) 一定是G的唯一的纳什均衡。 合,则 (s1 命题2.2 在n个博弈方的博弈 G S1,..., Sn ; u1,..., un 中, * * 如果 (s1 ,..., sn ) 是G的一个纳什均衡,则严格下策反复消去 法一定不会将它消去。
11
2.2 基本分析思路和方法

箭头法 思路 对博弈中的每个策略组合进行分析,考察在每 个策略组合处各个博弈方能否通过单独改变自己的 策略而增加得益。 如能,则从所分析的策略组合对应的得益数组 引一箭头,到改变策略后策略组合对应的得益数组。
完全信息静态博弈——基本分析思路和方法

2 完全信息静态博弈--博弈论

2 完全信息静态博弈--博弈论

Then 1 should choose “a”.
– Player 1’s best response to “B” is “a”.
Strategy a b c
A
12,11 11,10 10,15
Player 2
B
11,12 10,11 10,13
C
14,13 12,12 13,14
Player 1
2.1.3 上策均衡
上策
– 在某个博弈中,不管其他博弈方选择什么策 略,一博弈方的某个策略给他带来的得益始 终高于其它策略,至少不低于其它策略。
上策均衡
– 一个博弈的某个组和策略中的所有策略都是 各个博弈方各自的上策。这样的策略组合为 该博弈的一个“上策均衡”。
智猪博弈(boxed pig game)
Exercise: 田忌赛马
每次双方各出三匹马,一对一比赛三场,每一 场的输方要赔一千斤铜给赢方。
齐王的上、中、下三匹马分别比田忌的上、中、 下马略胜一筹。但田忌的上马比齐王的中马和 下马好,中马比齐王的下马好。
扩展成一个博弈问题,写出支付矩阵。
田忌
上中下 上下中 中上下 中下上 下上中 下中上 上中下 3,-3 1,-1 1,-1 1,-1 -1,1 1,-1
Scenario Analysis
Similarly, if 1 thinks 2 will choose C…
– Player 1’s best response to “C” is “a”.
Player 2
Player 1
Strategy a b c
A
12,11 11,10 10,15
B
11,12 10,11 10,13

1博弈论概述2完全信息静态博弈3完全信息动态博弈4


②从局中人行动的先后顺序可划分为静 态博弈(Static game)和动态博弈 (dynamic game)。静态博弈是指在博弈中, 局中人同时选择行动或虽非同时行动但后行 动者并不知道先行动者采取了什么具体行动。 动态博弈是指局中人的行动有先后顺序,且 后行动者能够观察到先行动者所选择的行动。
③从局中人是否具有有关其他参与人 (对手)的特征、策略空间及支付函数方面 的知识的角度,可划分为完全信息博弈
合作博弈和非合作博弈的区别在于人们的行动为相互 作用时,当事人能否达成一个具有约束力(binding agreement)的协议。若有,就是合作博弈;否则就是非合 作博弈。例如,两个寡头企业,如果他们之间达成一个协议, 联合最大化垄断利润,且各自按该协议生产,即是合作博弈。 其面临的问题是如何分享合作带来的剩余。但若两个企业间 的协议不具有约束力,即没有哪一方能强制另一方遵守该协 议,每个企业都只选择自己的最优产量(或价格),则是非 合作博弈。另外,合作博弈强调的是团体理性、效率、公正 和公平。非合作博弈强调的是个人理性、个人最优决策,其 结果可能是有效率的,也可能是无效率的。
一、占优策略均衡
通常情况下,每个局中人的支付是博弈中所有参与 人策略的函数,故每个局中人的最优策略选择依赖于所 有其他参与人的策略选择。但在一些特殊博弈中,一个 参与人的最优策略选择可能并不依赖于其他参与人的策 略选择,即无论其他参与人选择什么策略,他的最优策 略是唯一的,这种最优策略被称为“占优策略” (dominant strategy)。 例:“囚徒困境” 囚徒困境是博弈论中的经典案例。该故事讲的是,两 个嫌疑犯作案后被警察抓住,分别被关在不同的房间里 进行审讯。警察知道两人有罪,但缺乏有力的证据,除 非两人之中有一个坦白。警察告诉每个人,他们的可选 择的策略与支付如下表:

经济博弈论 02 完全信息静态博弈(Park)

ui(S1*, ... Si-1*, Si*, Si+1*, ... Sn*) ≥ui(S1, ... Si-1*, Sij, Si+1*,… Sn*)
都成立,则称 {S1*, ...Sn*}为G的一个纳什均衡
YBU
Economics department
Cont.
二、纳什均衡的一致预测性质 一致预测:如果所有博弈方都预测一个特定博弈结果会
妻(囚徒 2 )
坦白
不坦白
-5, -5
0, -8
-8, 0
-1, -1
Payoff
YBU
Economics department
2.1 Cont.
二、下策均衡
严格下策(dominate str.):不管其它博弈方的策略
如何变化,给一个博弈方带来的收益总是比另一种
策略给他带来的收益小的策略,
ui (Si’ , S-i) ≥,> ui (Si*, S-i ) ,分别称为弱下策、严格下
Cont.
二、混合策略、混合策略博弈和混合策略纳什均衡 混合策略:在博弈 G={S1, ...Sn; u1, ...un} 中,博弈方 i 的 策略空间 {Si1, ...Sik} ,则博弈方 i 以概率分布{pi1, ...pik}随 机在其k个可选策略中选择的“策略”,称为一个“混合策 略”,其中0< pij <1 , 对 1< j <k,都成立, pi1+ ...pik=1 混合策略扩展博弈:博弈方在混合策略的策略空间(概率 分布空间)的选择看作一个博弈,就是原博弈的“混合策略 扩展博弈)。
Strategy:[0 ,p1max], [0 ,p2max] Payoff: q1(p1, p2)=28- p1-0.5p2 , q2(p1, p2)=28- p2-0.5p1 , c1=c2=2; ➢ u1=(p1-2)(28- p1-0.5p2); u2=(p2-2)(28- p2-0.5p1); Howe to find the equilibrium?

第2章完全信息静态博弈


存在问题
▪ 伯特兰德模型之所以会得出这样的结论,与它的前提假 定有关。从模型的假定看至少在以下两方面的问题:
▪ ①假定企业没有生产能力的限制。如果企业的生产能力 是有限的,它就无法供应整个市场,价格也不会降到边 际成本的水平上。
▪ ②假定企业生产的产品是完全替代品。如果企业生产的 产品不完全相同,就可以避免直接的价格竞争。
演唱会
李 亚
足球
2,1

演唱会 -1,-1
0,0 1,2
某策略组合只有指向的箭头,没有 指离的箭头,则为稳定性的策略组合
猜硬币方

硬 币
正面
方 反面
正面
方面
-1,1 1,-1
1,-1 -1,1

弈上 方
1

博弈方2



1,0 1,3 0,1
0,4 0,2 2,0
1.3 画线法
由于决策的原则是使自己的得益尽可能的 大。同时由于一方的得益取决于其他方的策 略。
s
令p 为商店i的价格,D (p ,p ) 为需求函数, i=1,2。
i
i 12
如果住在x左边的将都在商店1购买,而住在xs右边的将在商店 s 2购买,需求分别为:
D =x,D =1-x,
1
2
这里x满足 p1+tx=p2+t(1-x)
解上式,得需求函数分别为: D1(p1,p2)=x=(p2-p1+t)/2t D2(p1,p2)=1-x=(p1-p2+t)/2t
第二章
博弈论——完全信息静态博弈
static games of complete formation
完全信息静态博弈

2 完全信息静态博弈


2 政府
救济 3,
3
-1,
1 0 0,
1 )( ( )) ( 01
不救济 -1,
求微分,得到政府最优化的一阶条件:
同样,可以根据流浪汉 的期望效用函数找到政 府的最优混合策略。??
即:流浪汉以0.2的概率选择寻 找工作,0.8的概率选择游荡
四. 混合策略纳什均衡

社会福利博弈
四. 混合策略纳什均衡

社会福利博弈
救济 政府
流浪汉
寻找工作 2 3, 1 不救济 -1, 0, -1, 0 流浪 3
设:政府救济的概率:1/2 ;不救济的概率:1/2。 流浪汉:寻找工作的概率:0. 2;流浪的概率:0.8 每个参与人的策略都是给定对方混合策略时的最优策略
四. 混合策略纳什均衡
四. 混合策略纳什均衡

策略:参与人在给定信息集的情况下选择行动的规则, 它规定参与人在什么情况下选择什么行动,是参与人 的“相机行动方案”。
纯策略:如果一个策略规定参与人在每一个给定的信 息情况下只选择一种特定的行动,该策略为 纯策略。 混合策略:如果一个策略规定参与人在给定信息情况 下以某种概率分布随机地选择不同的行动, 则该策略为混合策略。

由于混合策略伴随的是支付的不确定性,因此参与 人关心的是其期望效用。
最优混合策略:是指使期望效用函数最大的混合策 略(给定对方的混合策略) 在两人博弈里,混合策略纳什均衡是两个参与人的 最优混合策略的组合。


支付最大 化法
四. 混合策略纳什均衡
流浪汉
寻找工作 流浪
假定政府的混合战略是 G , ); ( 1 流浪汉的混合战略是 L , )。 ( 1 政府的期望效用函数为: v( G, L) (3 1 ( )( )) 1 (5 1 ) vG 5 1 0 故 * 0.2
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
魏光兴——重庆交通大学 12
2012-11-7
2、智猪博弈III

练习:用重复剔除严格劣战略求以下博弈的纳什均衡
上 下 左 中 右 1,0 1,3 0,1 0,4 0,2 2,0

智猪博弈背后的哲理


小猪角度:自己不能努力,即使努力劳动成果也会被大猪 侵占,所以最优选择是等待,坐享大猪的劳动成果,这称 为搭便车(free-riding)。但是,因为如此,小猪没有权利, 很多时候处于任人宰割的地位。 大猪角度:自己必须努力工作,不得不让小猪分享部分劳 动成果。但也正因为如此,大猪拥有主导权,而这种权利 可以使大猪在利益分配中获得更多的利益。
卖表
不卖
0,0 1,2
魏光兴——重庆交通大学
2,1 0,0
16
2012-11-7
3、最优反应与画线法II

最优反应

给定对方的战略选择,我方的最优战略 在最优反应战略对应的数字上画线 如果某战略组合都画上了线,那就是纳什均衡。此时,各 方的行为选择都是给定对方战略下的最优选择,每一方都 不能通过单方面的改变行为选择来提高自己的收益。 麦琪 剪发 吉姆 不剪 2,1 0,0
2012-11-7
魏光兴——重庆交通大学
20
4、多重均衡与协调II

多重均衡的协调





权威方,比如性别战博弈中,许多家庭习惯于听从某一方 的安排,形成了事实上的权威方。 树立非理性形象,比如在斗鸡博弈或性别战博弈中,以非 理性闻名的一方往往会获得胜利。 协商,比如吉姆可以事先给麦琪发条短信,告诉她卖了表 给她买了梳子。 相关均衡,比如性别战博弈中双方可以通过抛硬币来决定, 现实中交通管制还广泛实施的单双号通行。 聚点均衡,人们会选择习惯的行为,习惯就是聚点。 帕累托占优均衡,如协调博弈。 风险占优均衡,如鹿-兔博弈。

注册会计师 B 隐瞒 实报 注册会计师 A 隐瞒 实报 5,5 -1,6
6,-1
0,0
2012-11-7
魏光兴——重庆交通大学
8
1、囚徒困境与占优均衡VIII

委托-代理(principal-agent)关系中被设计的囚徒困境

压低供应商价格
假设:两供应商成本都为6元/件,报价都为10元/件。 策略:如果二者报价都为10元/件或8.5元/件,则从每家订购 50件;若一家报价10元/件而另一家报价8.5元/件,则从价低 者订购100件。

委托-代理(principal-agent)关系中被设计的囚徒困境

委托-代理关系

通常的含义是委托人请代理人代理某件事情。其中的关键问 题是二者利益不一致,并且委托人不知道代理人是否努力工 作(称为信息不对称),甚至委托人没有办法监督代理人的 工作。为此,需要设计一种制度(system),使代理人在追求自 己利益的同时也最大化委托人的利益,如何设计这样的制度 就是信息经济学(information economics)研究的问题。由于在 经济学中,制度与合同/合约/契约(contract)、机制(mechanism) 等词具有相同含义,信息经济学又称为机制设计理论、合同/ 合约/契约理论。又由于是研究委托代理关系,也称为委托代 理理论。其实质是激励代理人按照委托人的利益行事,还称 为激励理论(Incentive Theory),注意与管理学中激励理论差异。
魏光兴——重庆交通大学 3

纳什均衡


占优均衡

2012-11-7
1、囚徒困境与占优均衡III

思考

攻守同盟是否可行? 个体理性与集体理性之间的矛盾:实现集体利益时才能实 现个人利益,单纯追逐个人利益往往不能实现。 亚当斯密《国富论》中无形之手就是自利的个体理性:我 们的晚餐不是来自屠夫、酿酒的商人或面包师傅的仁慈之 心,而是因为他们对自己的利益特别关注„„每个人都会 尽其所能,运用自己的资本争取最大的利益,一般而言, 他不会有意图为公众服务,也不自知对社会有什么贡献, 他关心的仅仅是自己的安全、自己的利益,但如此一来, 他就好象被一只无形的手引领,在不知不觉中对社会改进 尽力而为„„

一头大猪和一只小猪生活在同一猪圈里,共用一食槽。食 槽的一端有一个开关,猪用嘴一拱,食槽的另一端会掉下 包子。假定按一下会掉下10个包子,而跑去按开关的猪会 耗费3个包子的能量。如果小猪按开关,大猪先吃,等小猪 按完跑过来时,大猪会吃掉8个包子,小猪只能吃到2个; 如果大猪先按开关,按完后跑过来,小猪会吃掉4个包子, 大猪可以吃到6个;如果都不去按开关,就会被一起饿死。 小猪
公鸡2
2012-11-7
魏光兴——重庆交通大学
18
3、最优反应与画线法IV

练习:用画线法求解下列博弈的纳什均衡

复杂例子
C1
R1 4,3
C2 5,1
C3 6,2
R2
R3

2,1
3,0 左 左 右 20,20 0,0
8,4
9,6 右 0,0 5,5
3,6
2,8
协调博弈
2012-11-7
魏光兴——重庆交通大学

供应商 B 8.5 10 供应商 A 8.5 10
2012-11-7
125,125
250,0
0,250
200,200
9
魏光兴——重庆交通大学
1、囚徒困境与占优均衡IX

回顾:博弈论、互动局势与名人名言

博弈论

研究互动局势下的最优行为决策,必须考虑自己的行为对他 人利益的影响,以及他人对自己行为的反应。
17

画线法

卖表
不卖
0,0 1,2
魏光兴——重庆交通大学
2012-11-7
3、最优反应与画线法III

练习:用画线法求解下列博弈的纳什均衡

性别战博弈 韩剧 妻子 韩剧 足球 2,1 0,0
丈夫 足球 0,0 1,2

斗鸡博弈
公鸡1 进攻 后退 后退 进攻 1,1 2,-2 -2,2 -4,-4
如果对任意 i,均有 s * * * * * 称战略组合 ( s 1 , s 2 , , s i 1 , s i , s i 1 , s n* )为博弈G的一个纳什均衡。 也就是说,给定其他人的战略选择,任意局中人都实现了最 大收益,或者不能通过改变自己的战略提高收益。 即,在纳什均衡中,每一个局中人都不能单方面改变自己的 战略来提高收益,从而每一个人都不会再改变战略,是一个 相对静止的状态——因此称为均衡。
19
4、多重均衡与协调I

多重均衡的协调



很多博弈具有多个纳什均衡,比如以上讲到的麦琪的礼物、 性别战、斗鸡博弈与协调博弈等,称为多重均衡。 在某些具有多重均衡的博弈中,各个博弈方偏好于不同的 均衡结果,如麦琪的礼物、性别战和斗鸡博弈;而在另一 些具有多重均衡的博弈中,各个博弈方偏好于同一个均衡 结果,如协调博弈。 那么,博弈方如何使自己偏好的均衡称为实际的均衡结果 呢?这就是多重均衡的协调问题。
2012-11-7
魏光兴——重庆交通大学
7
1、囚徒困境与占优均衡VII

委托-代理(principal-agent)关系中被设计的囚徒困境

预防审计合谋—双头审计
经理与注册会计师之间可能合谋,隐瞒不良信息。 股东解决这一问题的一种做法是双头审计,请两位会计师进 行审计,扣发给隐瞒者的部分报酬,而给坚持如实报告问题 的注册会计师以更多的报酬。
博弈与决策
Game Theory and Decisions
第二章:完全信息静态博弈
Chapter II: Static Game of Complete Information
魏光兴 重庆交通大学管理学院 wgx777@
1、囚徒困境与占优均衡I

囚徒困境(Prisoners’ Dilemma)
2012-11-7
魏光兴——重庆交通大学
5
1、囚徒困境与占优均衡V

如何走出囚徒困境?

可信的(由第三方实施的、据说黑社会中存在的)报复 历史上的 “人质”或“通婚”方案 军队中的(有些企业试图培养的)“忠诚”文化 长期重复关系
2012-11-7
魏光兴——重庆交通大学
6
1、囚徒困境与占优均衡VI

模型描述

等 按 4,0 等 3,4
大猪
2012-11-7
8,-1
魏光兴——重庆交通大学
0,0
11
2、智猪博弈II

重复剔除严格劣战略




Iterated Elimination of Strictly Dominated Strategies 在求解纳什均衡过程中,可以剔除局中人的严格劣战略以 简化博弈,因为严格劣战略肯定不会被实施。 注意:一定是剔除“严格”劣战略,因为如果剔除的劣战 略不是严格的,那么有可能剔除纳什均衡。 如果重复剔除严格劣战略之后的战略组合是唯一的,那就 是纳什均衡。 但是,并不是所有纳什均衡都可以通过重复剔除严格劣战 略得到。 小猪 按 等 按 4,0 4,4 大猪 等 8,-1 0,0
魏光兴——重庆交通大学 4

背后哲理


看不见的手

2012-11-7
1、囚徒困境与占优均衡IV

现实中的囚徒困境

屡见不鲜的价格战 铺天盖地的广告战 曾经威胁世界甚至整个人类的军备竞赛 公共资源过度开采/公共品供给短缺 大学扩招、研究生扩招、大学贷款基建 备受批评却日益严重的应试教育 微妙的三角关系 年年都有的评优评先活动 各种资格考试广泛盛行
相关文档
最新文档