经济博弈论(3)
经济博弈论3

不借
最大利益为重,甲有一个 不可信承诺,正因为此所 以使得甲乙合作最成为了
分
甲 不分
(1,0)
不可能
(2,2)
(0,4)
开金矿博弈
在本博弈中,如果已打官
借
司是可信的,则甲在第二
甲
阶段一定会选择分,则乙
在第一阶段一定会选择借, 分
所以最终(借,分)。此
例也说明晚上的法律制度 (2,2)
制度,不仅哪呢过保障社
乙 借
初始信息集和进行博弈所
甲
需要的全部信息,能够自 成一个博弈的原博弈的一 分
不分
部分,称为原动态博弈的 (2,2)
乙
一个“子博弈”。
不借 (1,0)
子博弈:即动态博弈中满足 一定要求的局部所构成的 次级博弈
(-1,0) (0,4)
二级子博弈
三级子博弈
仿冒
A 不仿冒
B
不制止 (0,10)
制止
(-2,5) 制止
(-1,0) (0,4)
衡路上的节点。
3.4 几个经典动态博弈模型
3.4.1 寡占的斯塔克博格模型 3.4.2 劳资博弈 3.4.3 讨价还价博弈 3.4.4 委托人—代理人理论
3.4.1 寡占的斯塔克博格模型
斯塔克博格模型是动态的寡头产量博弈模型。 先后选择产量的产量竞争博弈 把古诺模型改为厂商1先选择,厂商2后选择,而
不委托 委托人的利益,R(E)是指较 高的产出, R(S)较低的产出,
2
接受
[R(0),0] 拒绝
w(E)是较高的报酬,代理人 要得到较高的报酬但有较高 的负效用-S, w(S)是较低的
2
[R(0),0]
报酬
代理人的选择
经济博弈论

1、纳什均衡的概念。
对于任一个博弈游戏来讲,一定存在这么一组策略,使得其对于任一个局中人而言都是最好的,如果其它的所有局中人不改变他们的策略的话。
2、非合作博弈与合作博弈的区别。
形成合作博弈的两个条件:(1)对联盟来说,整体收益大于其每个成员单独经营时的收益之和。
(2)对联盟内部而言,应存在具有帕累托改进性质的分配规则,即每个成员都能获得比不加入联盟时多一些的收益。
如何保证实现和满足这些条件,这是由合作博弈的本质特点决定的。
也就是说,联盟内部成员之问的信息是可以互相交换的,所达成的协议必须强制执行。
这些与非合作的策略型博弈中的每个局中人独立决策、没有义务去执行某种共同协议等特点形成了鲜明的对比。
因此可以说:形成合作博弈的原因是在某种制度约束下的集体理性战胜了个人理性。
3、解释下列概念:纯策略、混合策略、策略组合、纳什均衡、贝叶斯均衡、反应函数在完全信息博弈中,如果在每个给定信息下,只能选择一种特定策略,这个策略为纯策略。
纯策略是混合策略的特例。
按照一定的概率,从一套“纯策略”中随机选取实际的对策,称为混合策略。
混合策略是纯策略在空间上的概率分布,纯策略是混合策略的特例。
策略组合指参与者可能采取的所有行动方案的集合。
策略集合必须有两个以上元素,否则,无所谓对策,只是独自决策。
所谓贝叶斯纳什均衡是指这样一组策略组合:在给定自己的特征和其他局中人特征的概率分布的情况下,每个局中人选择策略使自己的期望支付达到最大化,也就是说,没有人有积极性选择其他策略反应函数,在无限策略的古诺博弈模型中,博弈方的策略有无限多种,因此各个博弈方的最佳对策也有无限种,它们之间往往构成一种连续函数的关系,把这个连续函数称为反应函数。
4、解释下列概念:博弈、静态博弈和动态博弈、完全信息博弈和不完全信息博弈、完美信息动态博弈和不完美信息动态博弈博弈是指在一定的游戏规则约束下,基于直接相互作用的环境条件,各参与人依靠所掌握的信息,选择各自策略(行动),以实现利益最大化和风险成本最小化的过程。
博弈论专题(经济学专题)2007.9

市场进入阻挠博弈树
(3)、概念:一个纳什均衡称为精炼纳什均衡,当且只当参 与人的战略在每一个子博弈中都构成纳什均衡,即组成精炼纳 什均衡的战略必须在每一个博弈中都是最优的。因此,(进入, 斗争)不是一个精炼纳什均衡,而(进入,合作)是惟一的子 博弈精炼纳什均衡。
* “ 不可置信——承诺行动”的例子: 谈恋爱;
(2 )扩展性博弈形式的5个要素:参与人;每个参与人选择
行动的时点;每个参与人在每次行动时可供选择的行动集合;每 个参与人在每次行动时有关对手过去行动选择的信息;支付函数。
博弈树——是扩展型的一种形象化表述。 “子博弈”
(40,50) 在位者 合作
进入 进入者
不进入
斗争 (-10,0)
(0,300)
9,-1
0,0
搜集 大股东
等待
小股东
搜集
等待
5,1
4,4
9,-1
0,0
研发 大企业
等待
小企业
研发
等待
5,1
4,4
9,-1
0,0
3、性别战:
女 足球
芭蕾
男
足球 2,1
0,0
芭蕾 0,0
1,2
先动优势:若男的买票,两人就会出现在足球场;若女的买 票,两人就会出现在芭蕾舞厅;
4、斗鸡博弈: 进
A 退
(3)纳什均衡允许了不可置信威胁的存在。在市场进入的例 子中,如果在位者摆出一幅“你进入我就斗争”的架式,(不 进入,斗争)便成为一个纳什均衡。
在位者
默许
斗争
进入 进入者
40,50
不进入 0,300
-10,0 0,300
2、泽尔腾的贡献
(1)针对静态纳什均衡的问题,泽尔腾对动态博弈进行了分析, 定义了子博弈精炼纳什均衡。将纳什均衡中不可置信威胁战略剔 除出去,使均衡战略不再包含不可置信的威胁。它要求参与人的 决策在任何时点上都是最优的。决策者要“应变”,而不是 “固守”。
经济博弈论Chapter03_331007283

描求扩证序境。
of play.参无论何时采取行动,参与者都需要考虑他们当前的行动会如何影响未来的行动,包括对手和博它动,指出了博弈的所有可能结果。
决所有的连续决策点。
decision maker in a 博策树。
博节分每一分支都从博弈树上的一个决策点指向另一个决策点或终结点。
terminal node.在一个分支;不过,仅允许有一个分支指向任何一个决将引收益。
终结点并不是所有博弈必需的;一些博弈理论上可以永远进行下去on forever我参Anode is called a 参安均会发生什么?一个名叫卡门的少女正在决定是否要吸烟。
A teenager named Carmen is deciding whether to smoke.首如不一带给她不同的感受和收益。
taste, as well as different payoffs.单门分析一开始,考虑与终结点直接相连的那些行动点。
Start analysis by considering those action nodes that lead directly to terminal nodes.在利在通沿着贯穿整个博弈树的标出的唯一路径,就知道了当所有参与者在正确预测了所有的未来后果下做出最优选择时,这当由The outcome that arises from playing these在在会,甚至根本就没出现!但是,它的可能的出现和潜在的策略在决定今日卡门的招术时发挥了作用。
三每捐但为的所有结果进行赋值(排序)。
可3不多少种?如我均参不However, the equilibrium path of play is complete specification of the rollback equilibrium.它反略得到的。
艾尼塔根在街道花园博弈的反转均衡中,艾米丽得到了最好的结果(the opportunity to make the first move.先不后当这些操纵的招术就是Tactics for such manipulation are第第第第第第第三步:反转求解Step 3: Rollback第一它Slide 47一但一国然对实考有人拿出下。
经济学博弈

•
试想有两只公鸡遇到一起,每只公鸡有两
个行动选择:一是退下来,一是进攻。如果
一方退下来,而对方没有退下来,对方获得
胜利,这只公鸡则很丢面子;如果对方也退
下来双方则打个平手;如果自己没退下来,
而对方退下来,自己则胜利,对方则失败;
如果两只公鸡都前进,那么则两败俱伤。因
此,对每只公鸡来说,最好的结果是,对方
注意①对每一方,有限军备都是全局优势策略,扩军和
不设防都是全局劣势策略。
②此问题也可用重复剔除的占优均衡求得博弈问题
的解为(有限军备,有限军备)。
2024/10/12
中南财经政法大学信息学院
22
例7:寻找纳什均衡
2024/10/12
C1
C2
R1
100,100
0,0
50,101
R2
50,0
1,1
60,0
中南财经政法大学信息学院
21
军备考虑为扩军、有限军备、不设防,那么G为:
B
扩军
有限
裁军
扩军
(-2000,-2000)
(-1600,-1500)
(8000,-∞)
有限
(-1500,-1600)
(-500,-500)
(9500,-∞)
裁军
(-∞,8000)
(-∞,9500)
(0,0)
A
据划线法求得Nash均衡为双方采用有限军备策略。
中南财经政法大学信息学院
11
纳什均衡的含义就是:
给定你的策略,我的策略是最好的策略;给定我
的策略,你的策略也是你的最好的策略。即双方在给
定的策略下不愿意调整自己的策略。请同学分析:
洪开荣《经济博弈论》习题答案

《经济博弈论》思考题第1章纳什均衡1、每位学者的贡献都是建立在前者理论基础之上的,排名考虑的因素是理论的原创性。
纳什提出了纳什均衡概念,建立了一种互动分析模式;泽尔腾以纳什均衡为基础建立了策略性思维的动态分析模式;海萨尼提出海萨尼转换及其均衡体系。
2、博弈论学科对数学工具的利用使得博弈论乃至经济学成为一门真正的科学。
博弈均衡数学表达式的简明与繁复意味着背景事实的简明与繁复。
3、要素包括参与人,行动,支付和信息。
明确了三要素也就完成了建模。
模型的表述4分析方法就是关注各个参与人之间的互动及相互之间的影响。
比如,甲、乙两公司分数两个国家,在开发某种新产品时有下面矩阵表示的博弈关系的收益,这些不同策略组合下的收益则是双方互动选择的结果。
5、博弈论和经济学都是基于“理性人”的假设,人们都是追求自身利益的最大化。
以性别战博弈为例,女生选择芭蕾时,尽管男生更偏好足球,但此时他为使收益最大化,会选择芭蕾,即男生的最适反应是芭蕾。
同样,男生选择足球时,尽管女生更偏好芭蕾,但此时她为使收益最大化,会选择足球,即女生的最适反应是足球。
6、(1)博弈双方是在比较每个策略下自己的受益而做出选择,得益值的绝对值也就失去了意义。
必然会选择(不坦白,不坦白),因为这样双方的收益都能最大化。
7、博弈至少是在两方之间进行的,博弈的过程中双方都是理性的,在理性的指引下做出策略选择,故博弈论应包含理性、互动和决策。
其中理性是前提,互动是过程,决策时结果。
博弈过程中,各方都追求其自身的利益最大化,也就是给定对方的策略,自己的策略总是最优的。
博弈双方的两个最优反应以最适合的方式结合起来,也就是互为最适反应,这就会说博弈论的决策方法。
8、以囚徒困境为例,若双方同时选择抵赖,收益为(-1,-1),此时,双方收益和最大,但这种非纳什均衡的情况是不稳定的。
纳什均衡下,双方的策略为(坦白,坦白),收益为(-8,-8),此时收益明显比双方同时抵赖要低。
博弈论与经济生活(3)

例题: 重复剔除的占优均衡
行先生
M优于L 列先生
L
M
R 行:没有占优战略
U
1,0
1,2
0,1
列:M严格优于R
D 0,3
这里的占优战略或劣战略可能只是相对于另一 个特定战略而言。 ➢ 如果重复剔除后的战略组合不唯一,该博弈就 不是重复剔除的方法可解的。
安徽农业大学理学院 ·张成堂
例子 重复剔除的占优战略均衡
乙
L
M
R
U 甲
S
1,0 0,2
1,3 0,1
3,0 3,0
D 0,2
2,4
5,3
安徽农业大学理学院 ·张成堂
智猪博弈(Boxed Pig Game)
安徽农业大学理学院 ·张成堂
“智猪博弈”的启示
原版的“智猪博弈”故事给了竞争中的弱者 (小猪)以等待为最佳策略的启发。但是对于社 会而言,因为小猪未能参与竞争,小猪搭便车时 的社会资源配置的并不是最佳状态。为使资源最 有效配置,规则的设计者是不愿看见有人搭便车 的,政府如此,公司的老板也是如此。而能否完 全杜绝“搭便车”现象,就要看游戏规则的核心 指标设置是否合适了。
猪圈中有一头大猪和一头小猪,在猪圈的一 端设有一个按钮,每按一下,位于猪圈另一端 的食槽中就会有10单位的猪食进槽,但每按一 下按钮会耗去相当于2单位猪食的成本。
如果大猪先到食槽,则大猪吃到9单位食物, 小猪仅能吃到1单位食位食物;
如果小猪先到,大猪吃6单位而小猪吃4单位 食物。表5给出这个博弈的支付矩阵。
入大量资金进行技术创新,开发新产品,而中 小企业是小猪,不会进行大规模技术创新,而 是等待大企业的新产品形成新的市场后生产模 仿大企业的新产品的产品去销售。
经济博弈论(第三章)

第三章完全信息动态博弈上一章介绍了完全信息静态博弈,本章在前面的基础上探讨完全信息动态博弈。
现实社会经济活动的决策大多数是有先后顺序的行为而不是同时选择的行为,而且后行者能够看到先行者的决策内容,在先行者的决策结果之后再定夺自己的策略。
这样的经济行为比比皆是,如商业活动中的讨价还价,拍卖活动中的轮流竞价,资本市场上的收购兼并和反收购兼并都是如此。
依次选择与一次性同时选择有很大的差异,因此这种决策问题构成的博弈也是从时间序列上有别于静态博弈的,我们称之为“动态博弈”(Dynamic Games)。
例如下象棋通常需要两个参与人,我们定义为红方和黑方,红方先走,黑方后走,这是一个典型的完全信息动态博弈。
动态博弈由于添加了时间因素,因而更加贴近现实。
根据博弈方是否相互了解得益情况,可分为“完全信息动态博弈”和“不完全信息动态博弈”,根据是否所有博弈方都对自己选择前的博弈过程完全了解,可分为“完美信息动态博弈”和“不完美信息动态博弈”。
在本章中,我们首先对博弈的扩展式表达给出完整的定义,为动态博弈的分析奠定基础;其次,我们从扩展式表述博弈的纳什均衡分析逐步深入到子博弈精炼纳什均衡,为动态博弈的分析提供可行的方法,接下来介绍两种完全信息动态博弈经典模型;最后,分析具有无穷次的重复博弈,推导出无名氏定理。
3.1 博弈的扩展式表述在动态博弈中,博弈方的行动是有先后次序的,且后行动者在自己行动之前能够观测到先行动者的行动,每个博弈方的一次选择行为常称为一个“阶段”(Stage )。
动态博弈中也可能存在几个博弈方同时选择的情况,这时博弈方的同时选择构成一个阶段。
一个动态博弈至少有两个阶段,因此动态博弈有时也称为“多阶段博弈”(Multistage Games )。
此外,也有把动态博弈称为“序列博弈”(Sequential Games )的,这也是由动态博弈中的次序特征引出来的。
设有一个商人要从A 地向B 地运输一批货物。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
博弈的基本概念及战略表述
需求大的情况 开发商A 开发 不开发 需求小的情况 开发 不开发
开发商B 开发 不开发
4000,4000 0,8000 8000,0 0,0
开发商B
开发
-3000,-3000 0,1000
不开发
1000,0 0,0
3
开发商A
2013-7-27
博弈的战略式表述
博弈的基本概念及战略表述
• 博弈的基本特征是一个参与人的支付不仅取决于自己 的战略选择,而且取决于所有其他参与人的战略选择
2013-7-27 10
博弈的基本概念及战略表述
结果:博弈分析感兴趣的所有东西 如均衡战略组合、均衡行动组合、均衡支付组合等。
2013-7-27
11
博弈的基本概念及战略表述
均衡:所有参与人的最优战略的组合 一般记为:
(乙至多失去的数)
例、设有一个两人零和有限对策、博弈方A的支付矩阵如下:
7 3 16 3 8 2 4 1 9 0 5 1
求A和B的最优策略。
24
2013-7-27
解:
min : 7 1 8 -8 2 2 4 3 16 1 9 -9 3 0 5 -3 max : 16 2 5 min : 2
解:方案一
• 情形一:甲选α3,乙选β3。
结局:博弈方甲不仅得不到9,反而输掉10。
• 情形二:考虑到乙选β3的心理,甲选α4。
结局:博弈方乙不但得不到10,反而损失6。 分析得,双方都要考虑如何在不冒风险的情况 下得到自己最好的收入。
2013-7-27 19
方案二
• 对博弈方甲: A中每一行的最小数字(赢得最少—最坏的情 况)分别是: -8, 2, -10, -3 其中最大数字(最好的结果)为2。 结果是:博弈方甲选α2参加博弈时,可保证收 益不低于2。
i
max : 2
max min aij 甲方:
i j
2
乙方: min max a
j
ij
2
结论:甲方的最优策略为:策略a2 ,乙的最优策略为:策略b2。
2013-7-27 25
三、一般两人博弈分析(一)占优策略均衡
1、优劣策略
• 定义:设有G ={S1,S2,A,B} 若对一切j(1≤j≤n),均有 aij≥akj 则称博弈方甲的纯策略αi优于纯策略αk, 或纯策略αk劣于纯策略αi。 同样,若对一切i(1≤i≤m)均有 bij≥bik 则称博弈方乙的纯策略βj优于纯策略βk, 或纯策略βk劣于纯策略βj。
2013-7-27 26
• 例3、设G={S1,S2,C}
1 C 2 3
(1,1) (2,3) (2,1) (1,2) (1,4) (7,4) (2,5) (4,3) (7,3)
1
2
3
试分析策略的优劣。
解: 对于甲: 由a3j≥ a2j
自然:指决定外生的随机变量的机制 为分析方便引入,自然作为虚拟参与人没有自己的支付和 目标函数(即所有结果对它是无差异的)
2013-7-27 5
不完全信息静态博弈-贝叶斯纳什均衡 海萨尼(1967-1968)
行动
自然选择参与人的类型
你 接受 不接受
-50,0 0,0 100,100
求爱博弈: 品德优良者求爱 求爱者
2013-7-27
8
博弈的基本概念及战略表述
战略:参与人在给定信息集的情况下选择行动的规则, 它规定参与人在什么情况下选择什么行动,是参与人 的“相机行动方案”。
si 表示第i个参与人的特定战略 Si si 代表第i个参与人所有可选择的战略集合 如果n个参与人每人选择一个战略, n维向量s s1,s2, ,si, ,sn)称为一个战略组合 ( si 表示第i个人选择的战略
在静态博弈中,战略和行动是相同的。 作为一种行动规则,战略必须是完备的。
2013-7-27 9
博弈的基本概念及战略表述
• 支付函数:参与人从博弈中获得的效用水平,或者指 参与人得到的期望效用水平。
ui 表示第i个参与人的支付(效用水平) u u1,u2, ,ui, ,un)为n个人的支付组合 ( ui是所有参与人战略选择的函数: ui ui s1 , s2 ,, si ,, sn
max min aij
2013-7-27
(甲至少可以获得的数)
23
i
j
其次,如果乙采取策略Nj ,则乙至多失去
max aij
i
(第j列的最大者)
由于乙希望ai j 越小越好,因此乙当然选择 j, 使得 达到最小。即乙选择策略Nj , 使得他的支付不多于:
max aij
i
min max aij
j i
2013-7-27 20
• 对博弈方乙: A中每一列的最大数字(输得最多—最坏情况) 分别是: 9, 2, 6 其中最小数字(最好的结果)为2。 结果是:博弈方乙选β2参加博弈时,可保证至 多输掉2。 结论:策略组合(α2,β2)是一个最稳妥能使 双方满足的一种策略组合。 • 也称这样的策略组合为博弈问题在纯策略范围 内的类对应着一个均衡 完全信息静态博弈 Nash均衡 完全信息动态博弈 子博弈精练Nash均衡 不完全信息静态博弈 贝叶斯Nash均衡 不完全信息动态博弈 精练贝叶斯Nash均衡
* 均衡(equilibrium): S * (S1*, ,S n ) 是指有博弈中的几个博弈方每方选取的最佳策略所组 成的一个策略组合。
4
2013-7-27
博弈的基本概念及战略表述
参与人:博弈论中选择行动以最大化自己效用的决策主体。
可以是自然人,也可以是团体,如企业、国家甚至由若干 国家组成的集团(OPEC、欧盟等)。
博弈的参与人集合:i , (1,2, , n) i代表参与人 N代表自然 虚拟参与人:“自然”作为虚拟参与人
2013-7-27
22
得益矩阵
a11 a21 A a m1
a12 a22 am 2
a1n a2 n amn
(第i行的最小者)
j
首先,如果甲采取策略Si ,则甲至少可以获得
min aij
j
由于甲希望ai j 越大越好,因此甲当然选择 i, 使得 min aij 达到最大。即甲选择策略Si 使得他的所获不少于:
* * s * ( s1 , , si* , , sn )
其中,si*是第i个参与人在均衡情况下的最优战略, 它是i的所有可能的战略中使ui或Eui 最大化的战略。 si s1, ,si 1 , si 1 , , sn )表示由除i之外的所有参与人的战略组成向量。 ( si*是给定si 情况下第i个参与人的最优战略意味着: ui ( si*, si ) ui ( si' , si )si' si* 均衡意味着对所有的i 1,2, , n, 上式同样成立
2013-7-27
15
二、两人零和博弈
• 定义:在两人博弈问题中,若各盈利矩阵 分别为: A=(aij)m B=(bij)m 且aij=-bij (或u1(s1i,s2j)+ u2(s1i,s2j)=0) 则称此博弈为两人零和博弈。
2013-7-27 16
• 特点
① 两人零和博弈表明,博弈方无论采取 什么策略,无论博弈的最终结局如何, 两个博弈方总有一方赢,另一方输, 且输赢数相同。 ② 定义中u1(s1i,s2j)+ u2(s1i,s2j)=0是 一种标准化。若u1(s1i,s2j)+ u2(s1i,s2j)=C,也是一种两人零(常) 和博弈。
即α3优于α2 对于乙: 由bi2≥ bi3 即β2优于β3
进入
不进入 0,0
100x+(-100)(1-x)=0 当x大于1/2时,接受求爱 求爱博弈: 品德恶劣者求爱
2013-7-27
接受 进入 求爱者
你 不接受
100, - 100 -50,0 0,0
6
不进入 0,0
对手特征、战略空间
不完全信息动态博弈-精练贝叶斯纳什均衡 泽尔腾(1965)
成语故事:黔之驴-驴虎博弈
2013-7-27 1
博弈的基本概念及战略表述
案例- 房地产开发项目-假设有A、B两家开发商 市场需求:可能大,也可能小 投入:1亿
假定市场上有两栋楼出售: 需求大时,每栋售价1.4亿, 需求小时,售价7千万;
如果市场上只有一栋楼
需求大时,可卖1.8亿 需求小时,可卖1.1亿
2013-7-27 2
2013-7-27 14
博弈方乙对应着一个盈利u2(s1i,s2j) 记bij= u2(s1i,s2j)
得博弈方乙的盈利矩阵 B=(bij)m 若cij=(aij,bij) 则有C=(cij)m=
(a11 , b11 ) ... (a1m , b1m ) ... ... ... ( a , b ) ... ( a , b ) mm mm m1 m1
• • 博弈论的基本概念包括: 参与人:博弈论中选择行动以最大化自己效用的决策主体; 行动:参与人的决策变量 战略:参与人选择行动的规则 信息:参与人在博弈中的知识,特别是有关其他参与人的特征和 行动的知识 支付函数:参与人从博弈中获得的效用水平 结果:博弈分析真正感兴趣的要素的集合 均衡:所有参与人的最优战略的组合 参与人、行动、结果称为博弈规则;博弈分析的目的是使用博弈 规则决定均衡。
老虎通过不断试探来修正对毛驴的看法, 每一步行动都是给定它的信念下最优的。最终 将毛驴吃掉。
行动 有先后 对手特征、 支付函数、 战略空间 未知