博弈(2)

合集下载

博弈论2-2. sequential bargaining

博弈论2-2. sequential bargaining

2
大连理工
张醒洲
2014/3/5
动态博弈
博弈的扩展式表示 反向归纳法
3
大连理工
张醒洲
2014/3/5
序惯谈判
• 一个三阶段谈判模型 • 鲁宾斯坦 (1982)模型
2014/3/5
大连理工
张醒洲
4
一个三阶段谈判模型
参与人1和2就一美元的分配进行谈判。他们轮 流提出方案:首先参与人1提出一个分配方案,参 与人2可以接受或拒绝;如果参与人2拒绝,就由参 与人2提出分配建议,参与人1选择接受或拒绝;如 此进行下去。 一个方案一旦被拒绝,它就不再有任何约束力, 并与博弈后续进程不再相关。每一个方案都代表博 弈的一个阶段,参与人都没有足够的耐心:他们对 后面阶段得到的收益进行贴现,每一阶段的贴现因 子为δ,这里0 <δ< 1。
s2都可立即
拿到),或者拒绝这一条件(在这种情况下,博弈将继续 进行,进入第三阶段);
大连理工 张醒洲 7
一个三阶段谈判模型: 时间顺序
(3) 一旦进入第三阶段,参与人1得到美元的s
,参与人2得到1-s,这里 0 <
s
< 1。
大连理工
张醒洲
8
一个三阶段谈判模型
阶段 1
提议(s1, 1-s1)
阶段 2
• 如果第3阶段开始的博弈均衡是( s, 1-s)的话,前述三 阶段博弈开始时第1人的最优方案是(1-δ(1- δs), δ(1- δs)) • 对无限期讨价还价博弈,第一阶段开始时参与者1提出的 最优方案是s, 且有
S= (1-δ(1- δs), δ(1- δs)) 即 S= 1/(1+δ)
2014/3/5 大连理工 张醒洲 13

博弈论4-2. double auction

博弈论4-2. double auction
2014-6-11
双向拍卖: 线性贝叶斯纳什均衡-3
线性贝叶斯均衡策略如下

8
大连理工 张醒洲
2014-6-11
双向拍卖: 线性贝叶斯纳什均衡-4
图3.2.2说明了卖方的类型高于3/4时,他要的卖价超过 了买方的最高可能出价pb(1)= 3/4,并且买方的类型低于1/4 时,他出的买价低于卖方的最低可能要价ps(0)= 1/4。
非完全信息静态博弈(2)
双向拍卖 Double Auction 张醒洲
1
大连理工 张醒洲
2014-6-11
议价区间,价格和剩余
• 讨价还价区间
– 卖方价格和买方价格构成的 区间
买家收益 卖家收益 vs
1
vb p 议价区间
• (个人) 客户剩余
– 买家愿意支付的价格与之实 际支付的价格之差
• 卖家剩余/毛利
– 交易价格与卖家的保留价格 或成本之差
0 图. 议价问题
2
大连理工 张醒洲
2014-6-11
双向拍卖
Double Auction
在双向拍卖中,买方和卖方对自己的估计是私人信息。
买方对标的商品的估价为 vb,卖方的估价为 vs,双方的估价都是 私人信息,并且服从[0,1]区间的均匀分布。如果买方以价格 p购得 商品,则可获得 vb- p的效用;如果交易不能进行,买方的效用为0。 如果卖方以价格 p出售商品,则可得到 p – vs的效用;如果交易不能
进行,卖方的效用亦为0。
卖方确定一个卖价 ps,买方同时给出一个买价 pb。如果 pb≥ps,则交易以 p=( ps+pb)/2的价格进行,如果 pb﹤ps ,则不发生
交易。
3
大连理工 张醒洲

博弈论(第二章)讲义

博弈论(第二章)讲义

纳什均衡的练习(1)
例1:囚徒困境
囚徒B
坦白
不坦白
坦白 囚徒A
不坦白
-5, -5 -8, 0
0, -8 -1, -1
纳什均衡的练习(2)
例2:智猪博弈
大猪

不踩
小猪
踩 不踩
1.5, 3.5 5, 0.5
- 0.5, 6 0, 0
纳什均衡的练习(3)
例2:猜硬币的博弈
猜硬币者


正 盖硬币者

-1, 1 1, -1
博弈方2
U
L
R
U 博弈方1
D
1, 0 0, 3
1, 2 0, 1
0, 1 2, 0
三、划线法
其中心思想是根据博弈方策略之间的相对优劣关系,导 出博弈分析的“划线法”。
例:下图中的得益矩阵表示两博弈方的一个静态博弈,
试使用划线法进行分析。 博弈方2



上 博弈方1

1, 0 0, 4
1, 3 0, 2
二、严格下策反复消去法
(1)如果在一个博弈中,不管其它博弈方的策略如何变 化,一个博弈方的某种策略给他带来的得益,总是 比另一种策略给他带来的得益要小,那么称前一种 策略为相对于后一种策略的一个“严格下策” 。
(2)经“反复消去”博弈方的严格下策以后,每个博弈 方
可选策略都缩小为一个策略。因此,每个博弈方都 选择各自剩下的一个策略所组成的策略组合,是这 个博弈的均衡解 。
0, 1 2, 0
划线法的练习(1) 例2:囚徒困境
坦白 囚徒A
不坦白
囚徒B
坦白
不坦白
-5, -5 -8, 0

博弈论第2章

博弈论第2章
贡献:决策制定理性观点方面有着杰出的贡献,对博弈论和其他许多经 济理论的形成起到了重要的乃至不可或缺的作用
• 托玛斯 谢林(Thomas C. Schelling )84岁,美国公民。他1951年 托玛斯-谢林( 谢林 岁 美国公民。 年 获得哈佛大学经济学博士学位。 获得哈佛大学经济学博士学位。后曾在美国哈佛大学的肯尼迪学 院教学长达20 20年 担任政治经济学教授, 院教学长达20年,担任政治经济学教授,并获得退休名誉教授 的称号。之后他还在美国马里兰大学公共政策学院和经济系担任 的称号。 教授,并获得退休名誉教授称号。 教授,并获得退休名誉教授称号。他教授的课程除包括经济学理 论外,还涉及外交、国家安全、核战略以及军控等多方面。 论外,还涉及外交、国家安全、核战略以及军控等多方面。
贡献:《冲突战略》、《武器与影响》等,其中前者是相关领域中最具 开创性的理论著作之一。他的理论和思想不仅运用在经济学分析中,在外 交、军事领域也深有影响。
Robert J. Aumann
Thomas C. Schelling
罗伯特·奥曼的博弈论
• • • • • 弈论:交互式条件下“最优理性决策” 完全竞争经济:参与者连续统模型 重复博弈论:理论系统性的发展 合作与非合作博弈论:非转移效用与理性的假设 其他贡献 “奥曼可衡量选择定理”、值集函数积分结 果等 评论:
博弈论的形成
博弈论的真正起点 博弈论的真正起点—— 真正起点—— 诺伊曼、 1944年 冯 诺伊曼、摩根斯坦 1944年《博弈论和经济行 Behavior) 为》 (Theory of Games and Economic Behavior) 在这本著作中引进了扩展形(Extensive Form)表 在这本著作中引进了扩展形( 扩展形 ) 示和正规形(Normal Form)或称策略形(Strategy 示和正规形( )或称策略形( 正规形 Form)、矩阵形(Matrix Form)表示,定义了极小化 )、矩阵形 )、矩阵形( )表示,定义了极小化 ),提出了稳定集( 极大解( ),提出了稳定集 极大解(Minmax Solution),提出了稳定集(Stable Sets)解概念等,正式提出了创造一种博弈论的一般理 )解概念等, 论的主意

博弈论导论 2

博弈论导论 2

图 2-5 军备竞赛
思考:现实生活中还有哪些情况属于囚徒困境? 练习:将团队生产问题模型化成囚徒困境;如何理解囚徒困境与“看不见的手”之间 的矛盾?
2.1.5 走出囚徒困境
从社会福利的角度讲,囚徒困境不是帕累托最优的,但这与理性人的假设并不矛盾。
① ②
这实际上是 Betrand 价格竞争模型。 这是 Hardin(1968)发表在 Science 上但是被经济学引用最多的例子。但是,最近有学者提出了“反公地 悲剧”理论。董志强(2007)启发我使用这个简单的收益矩阵而非复杂的数学模型。 白鲨在线 2
2.3.2 性别战
如图 2-12。两个博弈相同的地方在于:(1)存在多重均衡,而且双方各自偏向一个 均衡;(2)任何一个均衡结果都是帕累托最优的。信念扮演了重要的作用。在这个博弈中, 假设男方是一个有名的拳击手,而女方也知道这点,那么(拳击,拳击)应该是一个均衡结 果,而(芭蕾,拳击)不应该出现。
白鲨在线 5
2.3.4 协调博弈
如图 2-14,史密斯公司和琼斯公司独立地决定选择何种智能手机操作系统。若两家公 司选择同样的操作系统,销售会更好。 特征:存在多重均衡,但是一些均衡帕累托优于另一些均衡,这与性别战和斗鸡博弈 都不同。 提示:一定要注意不同博弈模型的结构性特征,而不是过于关注具体数字。 思考:现实生活中有哪些博弈是性别战、斗鸡博弈和协调博弈?
图 2-1 双边优势
图 2-2 单边优势
2.1.2 定义优势策略均衡
并且,我们有 命题:如果一个博弈 N ,{Si }i 1 ,{vi ()}i 1 存在优势策略均衡 s ,那么 s 就是惟一的 优势策略均衡,并且也是惟一的纳什均衡。 证明过程略(可做思考题或作业)。
白鲨在线 1

博弈习题2

博弈习题2

1、甲乙两公司属于两个国家,在开发某种新产品方面有下面得益矩阵表示的博弈关系(单位:百万美元)。

乙公司
甲公司开发
不开发
开发不开发
(1)该博弈的纳什均衡有哪些?
(2)如果乙公司的政府给予乙公司开发活动20万的财政补贴,那么双方的得益矩阵和新的纳什均衡如何变化?
2、一个工人给一个老板干活,工资为100元。

工人可以选择是否偷懒,老板可以选择是否克扣工资。

假设工人不偷懒有相当于 -50 元的负效用,老板想扣工资总有借口扣掉60元。

工人不偷懒老板有150元的产出,偷懒只有80元产出。

以上情况双方都知道,老板也可以观察到工人是否偷懒。

问题:请用博弈树表示以上博弈,并找出子博弈完美纳什均衡。

博弈论讲义2

博弈论讲义2
13
尽管许多博弈中重复剔除的占优均衡是一个合理 的预测,但并不总是如此,尤其是大概支付是某 些极端值的时候。
参与人B
L
参与人A
R -1000,9
U
8,10
D
7, 6
6, 5
U是A的最优选择,但是,只要有1/1000的概率B选R, A就会选D
14
斗鸡博弈
进 A 独木桥 纳什均衡:A进,B退;A退,B进 对于相当多的博弈,我们无法运用重复剔除劣战略的 方法找出均衡解。
1、Cournot Model of Duopoly
按竞争程度划分的市场类型(就卖方来说):
A 完全竞争市场 B 寡头竞争市场 C 独家垄断市场
29
市场类型不同,厂商之间行为特征不同,A与C 类型中,厂商的决策都是个体优化决策,而B类 型中寡头垄断竞争的本质就构成博弈,他们都 是理性的决策者,他们的行为既影响自身,又 影响对方。尽管两寡头由于垄断能给他们带来 一些共同的利益,但是他们的根本利益并不是 完全一致的。如果两寡头之间可以签定有约束 力的协议,彼此之间达成合作,形成完全垄断, 此时的博弈是一种合作博弈。然而在大多数情 况下,彼此之间很难达成有约束力的协议,这 样就是非合作博弈。
7
注意:
与占优战略均衡中的占优战略和劣战略不同,
这里的占优战略或劣战略可能只是相对于另一个
特定战略而言。
8
案例1-智猪博弈
小猪 按 大猪 按 5,1 等待 9,-1 等待 4,4 4大于1
0,0
0大于-1
按是小猪的严格 劣战略-剔除 “按”是大猪的占优战略,纳什均衡:大猪按,小猪等待
9
案例2
U 行先生
s * 是一个纳什均衡: 或者用另一种表达方式: 当且仅当 si* 是下述最大化问题的解时,

博弈论(2)

博弈论(2)

第一章完全信息静态博弈博弈论的基本概念及战略式表述纳什均衡纳什均衡应用举例混合战略纳什均衡纳什均衡的存在性与多重性第一节博弈论的基本概念与战略式表述博弈论的基本概念与战略式表述博弈论(game theory )是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。

博弈的战略式表述:G={N,(S i )i ∈N ,(U i )i ∈N }有三个基本要素:(1)参与人(players )i ∈N={1,2,…,n};(2)战略(strategies ),s i ∈S i (战略空间);(3)支付(payoffs ),u i =u i (s -i ,s i )。

均衡与均衡结果均衡战略(坦白,坦白)均衡支付(-6,-6)第二节纳什均衡占优战略均衡重复剔除的占优战略均衡纳什均衡完全信息静态博弈的几点特性同时出招,出招一次;知道博弈结构与游戏规则(共同知识); 不管是否沟通过,无法做出有约束力的承诺(非合作)一、占优战略均衡占优战略:不管对手战略为何,该参与人可找到一最佳战略。

定义:在博弈G={N,(S i )i ∈N ,(U i )i ∈N }中,如果对所有的参与人i,s i *是它的占优战略,那么所有参与人选择的战略组合(s 1*,…,s n *)成为该对策的占优战略均衡。

“囚犯困境”的扩展两个寡头企业选择产量公共产品的供给军备竞赛经济改革结论:一种制度安排,要发生效力。

必须是一种纳什均衡;否则,制度安排便不能成立。

案例2:智猪博弈猪圈里圈两头猪,一头大猪,一头小猪。

猪圈的一头有一个猪食槽,另一头安装一个按钮,控制着猪食的供应。

按一下按钮会有10个单位的猪食进槽,但谁按按钮谁就要付出2个单位的成本。

若大猪先到,大猪吃到9个单位,小猪只能吃1个单位;若同时到,大猪吃7个单位,小猪吃3个单位;若小猪先到,大猪吃6个单位,小猪吃4个单位。

支付如表。

智猪博弈的扩展股份公司承担监督经理职能的大股东与小股东股票市场上炒股票的大户与小户市场中大企业与小企业在研发、广告上的博弈公共产品的提供(富户与穷户)改革中不同利益分配对改革的推动二、重复剔除的占优战略均衡 绝对劣势战略:s i 是一绝对劣势战略当且仅当存在另一战略s i ’∈S i 使得u i (s i ,s -i )< u i (s i ’,s -i ) 对所有s -i ∈S -i 均成立。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

在经济学中,“智猪博弈”(Pigs’payoffs)是一个著名博弈论例 子。 如果改变一下核心指标,猪圈里还 会出现同样的“小猪躺着大猪跑”的 景象吗?试试看。
改变方案二:增量方案。投食为原来 的一倍分量。结果是小猪、大猪都会 去踩踏板。谁想吃,谁就会去踩踏板。 反正对方不会一次把食物吃完。小猪 和大猪相当于生活在物质相对丰富的 “共产主义”社会,所以竞争意识却 不会很强。 对于游戏规则的设计者来说,这 个规则的成本相当高(每次提供双份 的食物);而且因为竞争不强烈,想 让猪们去多踩踏板的效果并不好。
在经济学中,“智猪博弈”(Pigs’payoffs)是一个著名博弈论例 子。 答案是:小猪将选择“搭便车”策略, 也就是舒舒服服地等在食槽边;而大猪 则为一点残羹不知疲倦地奔忙于踏板和 食槽之间。 原因何在?因为,小猪踩踏板将一无 所获,不踩踏板反而能吃上食物。对 小猪而言,无论大猪是否踩动踏板, 不踩踏板总是好的选择。反观大猪, 已明知小猪是不会去踩动踏板的,自 己亲自去踩踏板总比不踩强吧,所以 只好亲历亲为了。 “小猪躺着大猪跑”的现象是由 于故事中的游戏规则所导致的。规则 的核心指标是:每次落下的事物数量 和踏板与投食口之间的距离。
在经济学中,“智猪博弈”(Pigs’payoffs)是一个著名博弈论例 子。 如果改变一下核心指标,猪圈里还 会出现同样的“小猪躺着大猪跑”的 景象吗?试试看。
改变方案三:减量加移位方案。投食 仅原来的一半分量,但同时将投食口 移到踏板附近。结果呢,小猪和大猪 都在拼命地抢着踩踏板。等待者不得 食,而多劳者多得。每次的收获刚好 消费完。 对于游戏设计者,这是一个最好 的方案。成本不高,但收获最大。
博弈
选择一:继续原地等待
选择前者,那么不知道要等到什么时候, 等待的滋味很难受,而且黑暗中很容易发生意外。
选择二:赶紧抹黑儿离开电影院
如果选择后者,那么其他人也要争抢着从电影院离开, 你可能会因为拥挤而被活活踩死,或迟迟走不出去!
博弈
wait leave
博弈
什么叫博弈?博弈的英文为game,我 们一般将它翻译成“游戏”。而在西 方,game的意义不同于汉语中的游戏。 在英语中,game即是人们遵循一定规 则下的活动,进行活动的人的目的是 使自己“赢”。奥林匹克运动会叫 Olympic Games。在英文中,game有竞 赛的意思,进行game的人是很认真的, 不同于汉语中游戏的概念。在汉语中, 游戏有儿戏的味道。因此将关于game 的理论,即game theory翻译成博弈论 或者对策论,是恰当的。
孔明\司马懿 守城 弃城 进攻 (被擒,大胜) (被擒,大胜) 后退 (逃脱,不胜不败) (逃脱,不胜不败)
在信息不充分的情况下,博弈参 与者不是使自己的支付或效用最 大,而是使自己的“期望支付 (或效用)”最大。 引例:如果让你在“有50%的可 能获得100元”与“有10%的可能 获得200元”两者之间进行选择, 你会如何选择? 你当然选前者,因为前者的 “期望所得”为:50%×100=50 元,而后者为:10%×200元=20 元。理性的人是选择前者的。
谢谢大家!
PK
分析:在这里,司马懿不知道自 己和对方在不同行动策略,而诸 葛亮是知道的,他们对博弈结构 的了解是不对称的,诸葛亮拥有 比司马懿更多的信息,当然会有 相对的优势。这种信息的不对称 完全是诸葛亮“制造出来的”。 因此这是一个信息不对称的博弈。
分析:在这里,孔明可以选择的策 略是“弃城”或“守城”。无论是 “弃”还是“守”,只要司马懿明 确知道他自己的情况,那么孔明均 要被其所擒。孔明惟一的办法就是 不让司马懿知道他自己的策略结果。 他的空城计是降低司马懿进攻的可 能收益,使得司马懿认为,后退比 进攻要好。
在经济学中,“智猪博弈”(Pigs’payoffs)是一个著名博弈论例 子。
原版的“智猪博弈”故事给了竞争中的弱者(小猪) 以等待为最佳策略的启发。但是对于社会而言,因为 小猪未能参与则的设计 者是不愿看见有人搭便车的,政府如此,公司的老板 也是如此。而能否完全杜绝“搭便车”现象,就要看 游戏规则的核心指标设置是否合适了。 比如,公司的激励制度设计,奖励力度太大,又 是持股,又是期权,公司职员个个都成了百万富翁, 成本高不说,员工的积极性并不一定很高。这相当于 “智猪博弈” 增量方案所描述的情形。但是如果奖励力度不大, 而且见者有份(不劳动的“小猪”也有),一度十分 努力的大猪也不会有动力了----就象“智猪博弈”减量 方案一所描述的情形。最好的激励机制设计就象改变 方案三----减量加移位的办法,奖励并非人人有份,而 是直接针对个人(如业务按比例提成),既节约了成 本(对公司而言),又消除了“搭便车”现象,能实 现有效的激励。
结果:司马懿想,诸葛亮一生谨慎, 不做险事,只有设定埋伏才可能如 此镇定自若,焚香操琴。此时,司 马懿觉得“退”比“进攻”更合理, 或者说期望效用更大。于是后军变 前军,前军变后军,后退而去。结 果是诸葛亮得以逃脱。
在经济学中,“智猪博弈”(Pigs’payoffs)是一个著名博弈论例 子。 这个例子讲的是:猪圈里有两头猪, 一头大猪,一头小猪。猪圈的一边有 个踏板,每踩一下踏板,在远离踏板 的猪圈的另一边的投食口就会落下少 量的食物。如果有一只猪去踩踏板, 另一只猪就有机会抢先吃到另一边落 下的食物。当小猪踩动踏板时,大猪 会在小猪跑到食槽之前刚好吃光所有 的食物;若是大猪踩动了踏板,则还 有机会在小猪吃完落下的食物之前跑 到食槽,争吃到另一半残羹。 那么,两只猪各会采取什么策略?
在经济学中,“智猪博弈”(Pigs’payoffs)是一个著名博弈论例 子。 如果改变一下核心指标,猪圈里还 会出现同样的“小猪躺着大猪跑”的 景象吗?试试看。
改变方案三:减量加移位方案。投食 仅原来的一半分量,但同时将投食口 移到踏板附近。结果呢,小猪和大猪 都在拼命地抢着踩踏板。等待者不得 食,而多劳者多得。每次的收获刚好 消费完。 对于游戏设计者,这是一个最好 的方案。成本不高,但收获最大。
在经济学中,“智猪博弈”(Pigs’payoffs)是一个著名博弈论例 子。 如果改变一下核心指标,猪圈里还 会出现同样的“小猪躺着大猪跑”的 景象吗?试试看。
改变方案一:减量方案。投食仅原来 的一半分量。结果是小猪大猪都不去 踩踏板了。小猪去踩,大猪将会把食 物吃完;大猪去踩,小猪将也会把食 物吃完。谁去踩踏板,就意味着为对 方贡献食物,所以谁也不会有踩踏板 的动力了。 如果目的是想让猪们去多踩踏板, 这个游戏规则的设计显然是失败的。
回归问题:在孔明—司马懿的博弈 中,孔明了解双方的局势,制造空 城假象的目的就是让司马懿感到进 攻有较大的失败的可能。如果我们 用概率论的术语来说,诸葛亮的做 法是加大司马懿对进攻失败的主观 概率。此时,在司马懿看来,进攻 失败的可能性较大,而退兵的期望 效用大于进攻的期望效用。即:司 马懿认为进攻的期望效用低于退兵 的效用。诸葛亮惟有通过这个办法, 才能让司马懿退兵。
1、囚徒博弈与我国应试教育的困境 囚徒困境可以用来说明许多现象。我 国目前的应试教育就是一个囚徒困境。
2、骑虎难下的博弈 案例:赌徒 3、《三国演义》中的空城计与信 息不对称的博弈 文本简介及分析: 《三国演义之空 城计》 视频赏析:《三国演义之空城计》
进入新的课程学习
诸葛亮误用马谡,致使街亭失守。司马懿引大 军十五万蜂拥而来。当时孔明身边别无大将, 只有一班文官,五千军士,已分一半先运粮草 去了,只剩二千五百军士在城中。众官听得这 个消息,尽皆失色。孔明登城望之,果然尘土 冲天,魏兵分两路杀来。孔明传令众将旌旗尽 皆藏匿,诸军各收城铺。打开城门,每一门用 二十军士,扮作百姓,洒扫街道。而孔明乃披 鹤氅,戴纶巾,引二小童携琴一张,于城上敌 楼前凭栏而坐,焚香操琴。司马懿自飞马上远 远望之,见诸葛亮焚香操琴,笑容可掬。司马 懿顿然怀疑其中有诈,立即叫后军作前军,前 军作后军,急速退去。司马懿之子司马昭问: “莫非诸葛亮无军,故作此态,父亲何故便退 兵?”司马懿说:“亮平生谨慎,不曾弄险。 今大开城门,必有埋伏。我兵若进,中其计 也。”孔明见魏军退去,抚掌而笑,众官无不 骇然。诸葛亮说,司马懿“料吾生平谨慎,必 不弄险;见如此模样,疑有伏兵,所以退去。 吾非行险,盖因不得已而用之”,我兵只有二 千五百,若弃城而去,必为之所擒。
相关文档
最新文档