博弈论9-2. Cheap Talk 与直接显示机制
博弈论平话

博弈论平话王则柯著中信出版社图书在版编目(CIP)数据博弈论平话/王则柯著. —北京:中信出版社,2011.4ISBN 978–7–5086–2656–7I. 博…II. 王…III. 对策论-普及读物IV. F224.32中国版本图书馆CIP数据核字(2011)第017280号博弈论平话BOYILUN PINGHUA著 者:王则柯策划推广:中信出版社(China CITIC Press)出版发行:中信出版集团股份有限公司(北京市朝阳区惠新东街甲4号富盛大厦2座邮编100029)(CITIC Publishing Group)承 印 者:开 本:787mm×1092mm 1/16 印 张:16.75 字 数:160千字版 次:2011年4月第1版印 次:2011年4月第1次印刷书 号:ISBN 978–7–5086–2656–7/F·2245定 价:39.00元版权所有·侵权必究凡购本社图书,如有缺页、倒页、脱页,由发行公司负责退换。
服务热线:010–84849283 http: // 服务传真:010–84849000 E-mail: sales@ author@目录前言·VII第一章 博弈三要素与囚徒困境·1民营书店的价格大战·3我怎样被博弈论吸引·6如此不公平,取胜概率却相等·10囚徒困境与博弈三要素·13从囚徒困境说严格优势策略均衡·16价格大战和双赢对局·19为什么主要讨论非合作博弈·22公共品供给的囚徒困境·25政治家的囚徒困境·28基数支付和序数支付·30美苏争霸的囚徒困境·33第二章 情侣博弈和协调博弈·37情侣博弈和纳什均衡·39情侣博弈的其他例子·42相对优势策略下划线法·45视觉友好的对角排列·48情侣博弈表达的对称性嗜好·51理性人一定自私自利吗?·54不该一律贬斥自利行为·57情侣的拥挤博弈·60默契是协调的一种方式·63劣势策略消去法的讨论·65第三章 简单博弈模型的应用·69智猪博弈和搭便车行为·71为什么大股东挑起监督经理的重任·74猎人博弈和帕累托优势·76斗鸡博弈和航行规则·79银行挤兑的成因和预防·83数据不同,结果各异·86囚徒困境两败俱伤的隐含条件·89禁鸣喇叭与交通顺畅·95串通作弊和风险优势·98营造克己奉公的制度环境·101“最惠客待遇”对谁有利·104风险优势的判定·107说说风险优势的从属地位·110风险厌恶的统计和理论·113| IV | 博弈论平话 |第四章 混合策略与均衡筛选·117扑克牌对色游戏·119混合策略和纳什定理·122寻找纳什均衡的反应函数法·125再说混合策略纳什均衡·130扑克牌讹诈游戏·136慕尼黑谈判模拟·141聚点均衡·143聚点均衡作为共识均衡·146聚点均衡的制度设置·148相关均衡·151商品品牌的“地域连坐”效应·154品牌地域连坐的博弈分析·157抗共谋均衡·161盯着不散伙的共谋·165德国世界杯警方的优势策略·169第五章 零和博弈与霍特林模型·173零和博弈与非零和博弈·175均衡的观察与验证·179纳什均衡与杂货铺定位·183西方两党政治的稳定性和欺骗性·187| 目录 | V |动机和实现不是一回事·191摊贩为什么都往市场门口挤?·193学校门口等出租车的争先行为·196多人博弈的霍特林模型·199对抗性排序·207经济学家的对称性偏好·211第六章 动态博弈和子博弈精炼均衡·215抓钱游戏·217你死我活,还是你好我好·221编排故事,加深理解·224博弈结果依赖制度设置·227树型博弈策略组合的粗线表示·230确定树博弈的纳什均衡·234树型博弈的子博弈·237子博弈精炼纳什均衡·240求解动态博弈的倒推法·244博弈论向自己出难题·247实验经济学和行为经济学·250索引·253| VI | 博弈论平话 |最近四五十年,经济学经历了一场博弈论革命。
博弈论完整版PPT课件

2-阶理性: C相信R相信C是理性的,C会将R4从R的战略空间中剔除, 所以 C不会选择C1;
3-阶理性: R相信C相信R相信C是理性的, R会将C1从C的战略空间中剔 除, R不会选择R1;
基本假设:完全竞争,完美信息
个人决策是在给定一个价格参数和收入的条 件下最大化自己的效用,个人的效用与其他人 无涉,所有其他人的行为都被总结在“价格”参数 之中
一般均衡理论是整个经济学的理论基石 和道义基础,市场机制是完美的,帕累托 最优成立,平等与效率可以兼顾。
.
3
然而在以下情况,上述结论不成立:
.
19
理性共识
0-阶理性共识:每个人都是理性的,但不知道其 他人是否是理性的;
1-阶理性共识:每个人都是理性的,并且知道其 他人也是理性的,但不知道其他人是否知道自己 是理性的;
2-阶理性共识:每个人都是理性的,并且知道其
他人也是理性的,同时知道其他人也知道自己是
理性的;但不知道其他人是否知道自己知道他们
如果你预期我会选择X,我就真的会选择X。
如果参与人事前达成一个协议,在不存在外部强 制的情况下,每个人都有积极性遵守这个协议,这 个协议就是纳什均衡。
.
28
应用1——古诺的双寡头垄断模型(1938)
假定:
只有两个厂商 面对相同的线形需求曲线,P(Q)=a-Q, Q=q1+q2 两厂商同时做决策; 假定成本函数为C(qi)=ciqi
劣策略:如果一个博弈中,某个参与人有占优策略,那么
该参与人的其他可选择策略就被称为“劣策略”。
博弈论9-2. Cheap Talk 与直接显示机制课件

PPT学习交流
8
Cheap Talk Game: message space
• Since the same information can be communicated in different languages, different message spaces can achieve the same results.
• 讲真话(truth-telling)
• 用 m=θ表示代理人讲真话
• 弱Nash均衡: 最优合同使代理人没有积极性去说谎,但 同时也没有积极性讲真话
• 有时可能是说与不说无差异.
• 如果代理人能从讲真话中得到显著好处,博弈模型应将 这一要点刻划清楚.因为讲真话的效用足够强时,可能 不存存委托-代理难题,从而与信息相关的激励成本就 消失了.这可能就是商业伦理与道德在减少交易费用方 面的作用.
• 对每个导致说谎(即m≠θ)的合同w(q,m),存在一个合同 w*(q,m)使得对每个θ而言,两个合同得到相同结果,并 且代理人没有积极性说谎.
• 显示原理指出:通过模拟自然状态与说谎者所获 得支付之间的关系,我们总可以找到一个代理人 不会说谎的合同.
PPT学习交流
22
显示原理:我不骗你,但不一定说 实话
• 销售员的支付 U = U(q, w, θ)
• 其中
PPT学习交流
21
显示原理:存在代理人不说谎的机 制
• 每个自然状态只有一个真相,却可以有一连串的谎 言.但是说谎是有成本的,因而也是有目的的.如果说 谎不能改善自己的处境,谁会说谎?
• 显示原理(the Revelation Principle)
PPT学习交流
12
例1:Cheap talk can convey private information
非完全信息动态博弈博弈论吉本斯.pptx

27
第28页/共59页
Example 1-厂商的分离均衡纯策略
•.
(保修,不保修)
(1,0.5) Y [1] 保修 厂商 不保修[0] Y (-1,1)
(0,0) N
H
[0.5]
N (0,0)
客户
自然
客户
(-1,-0.5)Y [0]
(0,0) N
保修
[0.5] L
不保修 [1] 厂商
Y (1,0.5) N (0,0)
19
第20页/共59页
Signaling game
• Sender和 Receiver 都有四个纯策略.
Sender的纯策略:
(m1,m1), (m1,m2), (m2,m1), (m2,m2)
(m1,m1), (m2,m2):混同(pooling strategies)策略
(m1,m2), (m2,m1):分离(separating strategies)策略
q1 1 1 q2
1
11
第12页/共59页
Requirement 4
• 要求 4. 对处于均衡路径之外的信息集, 推断由贝叶斯法则以及可能情况下的参与人的均衡策略给出. • 定义 .满足要求1到4的策略和推断构成博弈的完美贝叶斯均衡(perfect Bayesian equilibrium ).
17
第18页/共59页
Signaling game
•图
a1
m1
S
m2
a1
a2
t1 [p]
a2
R
N
R
a1
[1-p] a1
t2
a2
m1 S
m2
a2
博弈论ppt课件

精选课件ppt
7
囚徒B 坦白
不坦白
囚徒A
坦白 -8,-8 0,-10
不坦白 -10,0 -1,-1
精选课件ppt
8
博弈的分类
ห้องสมุดไป่ตู้
1、从行动的先后次序来分,博弈可以分为 静态博弈 和 动态博弈。 静态博弈指在博弈中,参与人同时选择行动,或虽非同 时但后行动者并不知道前行动者采取了什么具体行动;
动态博弈指的是参与人的行动有先后顺序,且后行 动者能够观察到先行动者所选择的行动的博弈。
21世纪,应站在博弈论的前沿。尽管博弈经济学家很少,但其获诺贝尔
奖的比例最高。最能震动人类情感的是博弈,对未来最有影响力的还是
博弈。
精选课件ppt
6
著名的“囚徒困境”的例子
警察抓住了两个罪犯,但是警察局却缺乏足够的证据 指证他们所犯的罪行。如果罪犯中至少有一人供认犯 罪,就能确认罪名成立。为了得到所需的口供,警察 将这两名罪犯分别关押防止他们串供或结成攻守同盟, 并分别跟他们讲清了他们的处境和面临的选择:如果 他们两人都拒不认罪,则他们会被以较轻的妨碍公务 罪各判一年徒刑;如果两人中有一人坦白认罪,则坦 白者立即释放而另一人将重判10年徒刑;果两人都坦 白认罪,则他们将被各判8年监禁。问:两个罪犯会 如何选择(即是坦白还是抵赖)?
不过,2号推知3号的方案,就会提出“98,0,1,1”的方案,即放 弃3号,而给予4号和5号各一枚金币。由于该方案对于4号和5号来说 比在3号分配时更为有利,他们将支持他而不希望他出局而由3号来分 配。这样,2号将拿走98枚金币。
同样,2号的方案也会被1号所洞悉,1号并将提出(97,0,1,2,0) 或(97,0,1,0,2)的方案,即放弃2号,而给3号一枚金币,同时 给4号(或5号)2枚金币。由于1号的这一方案对于3号和4号(或5号) 来说,相比2号分配时更优,他们将投1号的赞成票,再加上1号自己 的票,1号的方案可获通过,97枚金币可轻松落入囊中。这无疑是1号 能够获取最大收益的方案了!答案是:1号强盗分给3号1枚金币,分 给4号或5号强盗2枚,自己独得97枚。分配方案可写成(97,0,1,2, 0)或(97,0,1,0,2)。
博弈论最全完整ppt-讲解

迈克尔·斯彭斯 1948年生于美国的新泽 西,1972年获美国哈佛 大学博士头衔,现兼任 美国哈佛和斯坦福两所 大学的教授。
乔治·阿克尔洛夫 1940年生于美国的纽黑 文,1966年获美国麻省 理工学院博士头衔,现 为美国加利福尼亚州大 学经济学教授。
约瑟夫·斯蒂格利茨, 1943年生于美国的印第 安纳州,1967年获美国 麻省理工学院博士头衔, 曾担任世界银行的首席 经济学家,现任美国哥 伦比亚大学经济学教授
Because We Had a Flat Tire”
“乘客侧前轮”看起来是一个合乎逻辑的选择。 但真正起作用的是你的朋友是否使用同样的逻辑,或者
认为这一选择同样显然。并且是否你认为这一选择是否 对他同样显然;反之,是否她认为这一选择对你同样显 然。……以此类推。 也就是说,需要的是对这样的情况下该选什么的预期的 收敛。这一使得参与者能够成功合作的共同预期的策略 被称为焦点。心有灵犀一点通。
何最好地利用身体(物质)的技巧的一种算计。
什么是策略博弈?
What is a Game of Strategy?
• 策略思考本质上涉及到与他人的相互影响。其他人在同一时间、 对同一情形也在进行类似的思考。
• 博弈论就是用来分析这样交互式的决策的。 • 理性的行为指的是:明白自己的目的和偏好,同时了解自己行
如果一个博弈在所有各种对局下全体参与人之得 益总和总是保持为一个常数,这个博弈就叫常和 博弈;
相反,如果一个博弈在所有各种对局下全体参与 人之得益总和不总是保持为一个常数,这个博弈 就叫非常和博弈。
常和博弈也是利益对抗程度最高的博弈。 非常和(变和)博弈蕴含双赢或多赢。
导论
四、主要参考文献
没有某个这样的暗示,默契的合作就完全不可能。
博弈论在谈判中的应用课件

2、确立合作剩余
风险值确定后,会形成双方合作的剩余,就是我们上面所 说的1000元,但是,这里如何分配?却是最关键的问题,双 方的讨价还价、斗智斗勇就是为了确定双方的剩余。关于剩 余的分配,从来没有统一的标准,一般取决于双方实力的对 比和谈判策略与技巧的运用。实际上,对于许多谈判项目来 讲,合作的剩余是多少?也是一个难以确定的未知数,因为 合作剩余还应该包括一些附加的利益。
2
以博弈论解谈判
将复杂的、不确定的谈判行为通过简洁 明确的博弈分析使研究进一步科学化、规 范化、系统化,寻找出某些规律性的东西 。
谈判的本质特征,也都与一般游戏一样, 是在一定规则之下,参加方的决策较量, 这就是博弈现象。 ? 博弈有多种形式,这里我们主要借助于经 典博弈问题分析,建立谈判合作的基本模式 。
达成协议,是谈判各方分享合作剩余的保证,也是维系各 方合作的纽带。
32
的5000 元,王二的风险值为3000 元,李五的为
4000 元,所以,不合作解的总值为
3000+4000=7000 元。从合作解来看,如果王二
将车买给了李五,对李五来说,这辆车值4000 元,
另外,双方还有一个分享的利益。如3500 是交易
价格,王二赚得了500 元,李五会节余500 元,合作
解的总值是4000+500+3000+500=8000
24
合作目标的直接决定因素
? 获益结果的不平等
–当合作给另一方带来的利益大于己方时,合作 的愿望会逐渐消失
? 与另一方的关系
–在朋友之间采取C 回应策略的要比相互讨厌的 人之间可能性更大
–在得知目标相同的两方之间,其合作的可能性 要高于双方目标不同的人
博弈论 PPT资料整理

第一章博弈是一场至繁至简的游戏•1928年冯诺伊曼系统证明了博弈论的基本原理,并宣告了博弈论的诞生。
•1994年,纳什,海萨尼和泽尔腾曾因开创了非合作博弈均衡的分析理论活动诺贝尔经济学奖。
•2005年,谢林和奥曼因把博弈论引入国家管理,获得诺贝尔经济学奖。
博弈论也称对策论,原来是数学的一个分支,但由于它比较好的解决了对竞争等问题的可操作性分析,从而发展成为经济学中的一个研究领域,并以其鲜明的特征改变了经济学的传统研究其实,博弈论就是一种关于决策和对策的博弈的理论,更多的用于人与人之间,但是,因为人的思维是随环境、心情等不断变化的。
于是对于每个人每个时间应对的策略都是变化,这就增加了博弈分析的深度和难度。
中国古代的《孙子兵法》就不仅是一部军事著作,也算是世界上最早的一部博弈论专著。
博弈是个人、团队或其他组织、面对一定的环境条件,在一定的约束条件下依靠自身掌握的信息,同时或先后、一次或多次从各自可能的行为或策略集合中做出自己的选择并予以实施,从中取得相应的结果或收益的过程。
生活中的博弈:购物商场的选择、邀请朋友聚会、财物损失的报案、城管和小贩的游击战、老师考勤和学生翘课、恋人相处的艺术人们时时刻刻都在分析并预测他人的行为并作出相应的行动选择。
而博弈也恰恰就是通过理性思维来对你在人际交往中的现象进行分析和总结,并帮助你完成优化效果的过程。
特别是在现代,可以说人们在日常生活中的一切行为均可以通过博弈论来解释,因为博弈的本质就是在进行一场生存的游戏。
由此可见,博弈论是适合所有人的科学。
在人际交往的过程中,博弈就是运用你的智慧和理性思维,在纷繁的事件中选择能够使你的利益最大达到最大化的科学。
博弈论能够起到重要的作用,由此,你可以看到博弈论在生活当中的广泛应用。
可以说作为一门关系学,它是人与人之间的行动互相影响的科学,是伴随你一生的科学。
从围棋定式谈纳什均衡•过分的骗着与本手、缓手之间•一般以本手应对•着招过分不遇反击,则可能占到便宜,如遇反击则可能亏损•如果势均力敌,则应考虑到对手的反击手段。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
销售员博弈(2)
• 支付
– 假设经理为风险中性委托人,销售员为厌恶风险的代理 人. – 销售员的保留效用为U0=8, 经理的保留效用为0. – 如果签约, 则
• 经理的支付 π= q – w • 销售员的支付 U = U(q, w, θ)
– 其中
21
显示原理:存在代理人不说谎的机制
• 每个自然状态只有一个真相,却可以有一连串的谎 言.但是说谎是有成本的,因而也是有目的的.如果 说谎不能改善自己的处境,谁会说谎? • 显示原理(the Revelation Principle)
Cheap Talk “以上信息仅供参考”
嗨!留神
2014-谈博弈
• • • • 概念 例 分析 设计
2014-6-11
张醒洲,大连
2
概念:Cheap Talk vs. Signaling
• 一种面向特定对象、直接的、低成本的交流无约 束力(无法查证,无义务)观点的(口头)交流 。
17
信号与消息
• Signal
– 发送信号是有成本的 – 信号中包含有用信息
• Message
– 消息是无成本的声明 – “我就这样随口一说,莫要当真儿!” – 但有的消息是想述惑他人!
18
隐藏知识博弈,如何让人不撒谎?
• 例. 销售员博弈(the Salesman Game)
– 公司经理派销售员去调查一个潜在客户.针对普通客 户的促销努力很低,销售量也不会太高;如果这是一 个大客户,努力水平与销售量都将很高.这只是正常 情况下的努力水平与销售量之间的关系. – 对大多数客户,销售员提高努力水平有可能增加销售 量,经理希望对销售员的额外努力给予补偿,即设计 一种合同,激励销售员. – 当然销售员可以说这是一个普通客户,销售量高主要 是因为他尽力促销的结果,要求经理多给些报酬.
– “嗨!小心汽车”;
• 免责申明,道义劝告?
– “以上信息仅供参考” – “股市有风险,入市需谨慎!”
• 网络评论与留言跟帖 • …… one more, please!
2014-6-11 张醒洲,大连 4
Cheap Talk :why, how
• ISSUES
– 分析特定环境中 空谈博弈的效果; – 如何设计一个环境,以便发挥空谈博弈的优势;
2014-6-11
张醒洲,大连
9
perfect Bayesian equilibrium
• Because the simplest cheap-talk and signaling games have the same timing, the definitions of perfect Bayesian equilibrium in the two games are identical as well:
2014-6-11 张醒洲,大连 15
隐藏知识博弈,如何让人不撒谎 ?
显示原理
2014-6-11
张醒洲,大连
16
隐藏知识博弈,如何让人不撒谎?
• 例1.
– 业主雇用一个经理运营一个项目.业主可以看到经理 的工作表现e.签约后不可观测的是努力工作给经理带 来的负效用,例如加班、公关应酬对他家庭生活、身 心健康的影响只有他自己知道.有些经理喜欢这样, 这种工作也可能伤害某些经理的生活.如果业主要对 经理人给予补偿,所有经理都有可能声称工作的负效 应相当大.
– 用 m=θ表示代理人讲真话 – 弱Nash均衡: 最优合同使代理人没有积极性去说谎,但 同时也没有积极性讲真话 – 有时可能是说与不说无差异. – 如果代理人能从讲真话中得到显著好处,博弈模型应 将这一要点刻划清楚.因为讲真话的效用足够强时, 可能不存存委托-代理难题,从而与信息相关的激励 成本就消失了.这可能就是商业伦理与道德在减少交 易费用方面的作用.
2014-6-11
张醒洲,大连
12
例1:Cheap talk can convey private information
• 这个博弈中, sally没有动机 说谎,Rayco 会相信sally所 报的类型及为 其真实类型, 因此,空谈传 达全部信息。
2014-6-11
张醒洲,大连
13
例2. Cheap Talk becomes meaningless
– {messaging strategy, action strategy,belief about the type of the speaker}, – 4 conditions
2014-6-11
张醒洲,大连
10
perfect Bayesian equilibrium: Pooling, Separating
• One difference between signaling and cheap-talk games, however, is that in the latter a pooling equilibrium always exists.
– Because messages have no direct effect on the Sender‘s payoff, if the Receiver will ignore all messages then pooling is a best response for the Sender; because messages have no direct effect on the Receiver’s payoff, if the Sender is pooling then a best response for the Receiver is to ignore all messages.
• The interesting question in a cheap-talk game therefore is whether non pooling equilibria exist.
2014-6-11
张醒洲,大连
11
例1:Cheap talk can convey private information
• The key feature of such a cheap-talk game is that the message has no direct effect on either the Sender's or the Receiver's payoff.
– The only way the message can matter is through its information content: by changing the Receiver's belief about the Sender‘s type, a message can change the Receiver's action, and thus indirectly affect both players' payoffs.
– 博弈如下:
2014-6-11
张醒洲,大连
14
例 3. 适度拔高
• 与例 1和2背景相同,假定不同。 • 假定:Sally的能力区间是连续的(例如在[0,1]上的分布) ,如果Sally的真实类型是t ,则她希望Rayco相信她的能力 是t+b,这里b>0,是共同知识。 • 这种情况与Crawford和Sobel (Strategic Information Transmission,1982) 研究的问题一致。他们的研究表明只 要b在一定的取值范围内,cheap talk会起作用,存在均衡 ;随着b越来越大,信息的交流量就越少,当b足够大的时 候,cheap talk不起作用。也就是说,只要拥有私人信息 的一方的偏好在一定的范围内,空谈仍然能够起到传达信 息的作用。
– Cheap Talk 可以影响他人的观点/看法,以至于行动; – 言论、观点,交流手段与过程是低成本的,它们不直 接影响参与交流的主体的收益;
空谈有别于信号(发送与接受)
2014-6-11
张醒洲,大连
3
例
• 中央银行的政策表态 vs 公开市场业务
– 表态会起作用,但不能精确计算;
• 习惯性提示
19
销售员博弈(1)
• 参与人
– 经理,销售员
• 博弈顺序
– 1)经理提供给销售员一个工资合同w(q, m), 其中q表示 销售水平,m表示消息. – 2)销售员决定是否接受合同 – 3)自然以0.2与0.8的概率选择顾客为大客户或普通客户. 客户状态用θ表示,θ=大,小. –4)如果销售员接受合同,他选择销售量q,这间接地测量 了他的促销努力水平.
• 发现
– 发送者偏好的一致性会影响空谈的作用
• 条件(必要性)
– 空谈者偏好不同; – 接收者对不同类型发送者采取不同的反应
2014-6-11 张醒洲,大连 6
Cheap Talk Game: timing
2014-6-11
张醒洲,大连
7
Cheap Talk Game: Payment information: message vs. signal
• If there is too strong an incentive to lie, cheap talk becomes meaningless.
– 背景还是和example 1中一样,改变假定:
• because performance is hard to monitor and the demanding job is better paid, Sally wants the demanding job whatever her true ability。
– 对每个导致说谎(即m≠θ)的合同w(q,m),存在一个合同 w*(q,m)使得对每个θ而言,两个合同得到相同结果, 并且代理人没有积极性说谎.