博弈论专题(经济学专题)2007.9
第8章 博弈论

经济学原理
18
四种主要的均衡类型
完全信息 不完全信息
静态
动态
完全信息 不完全信息 NE:纳什均衡 纳什均衡 静态 静态( 静态(BNE) BNE:贝叶斯纳什 ) 贝叶斯纳什 贝叶斯 (NE) ) 均衡 子 完全信息 不完全信息 SPNE:子博弈精练 纳什均衡 动态 动态 SPBE:子博弈精练 子 (SPNE) (SPBE) ) 贝叶斯纳什均衡 贝叶斯纳什均衡
经济学原理 11
8.3.2 纳什均衡 纳什均衡
纳什均衡 纳什均衡(Nash Equilibrium) :在博弈分析中,纳什均衡是 Equilibrium) :在博弈分析中 纳什均衡是 博弈分析中, 所有参与人的最优战略组合。 注意: •均衡的战略组合包含了所有参与者的最优战略,是最优战 略的组合; •均衡战略组合是每一个参与者最优战略的交集,每个参与 人肯定存在最优战略,但是如果不存在交集,就没有均衡的 战略组合。 •均衡意味着:给定A的战略SA,B有最优战略SB;给定B的 均衡意味着:给定A的战略SA, 有最优战略SB;给定B 战略SB, 有最优战略SA,(SA,SB)就是均衡战略。 战略SB,A有最优战略SA,(SA,SB)就是均衡战略。
经济学原理
14
纳什均衡的简单解法 纳什均衡的简单解法
给定一方的选择,另一方的选择是最优的; 反过来,给定另一方的该选择,一方的选择 也是最优的,则该选择组合是纳什均衡。
B 坦白 A 坦白 不坦白 -8,-8 -10,0 10, 不坦白 0,-10 -1,-1
经济学原理
15
两小猜枚的支付矩阵和均衡 两小猜枚的支付矩阵和均衡
经济学原理
8
囚徒困境的标准表达式
李四( 李四(B) 坦白 张三 (A) 坦白 不坦白 -8,-8 -10,0 10, 不坦白 0,-10 -1,-1
博弈论最全完整-讲解PPT课件

王则柯、李杰编著,《博弈论教程》,中国人民大学 出版社,2004年版。
艾里克.拉斯缪森(Eric Rasmusen)著,《博弈与信 息:博弈论概论》,北京大学出版社,2003年版。
因内思·马可-斯达德勒,J.大卫·佩雷斯-卡斯特里罗著, 《信息经济学引论:激励与合约》,上海财经大学出版 社,2004年版。
常和博弈也是利益对抗程度最高的博弈。 非常和(变和)博弈蕴含双赢或多赢。
.
32
导论
四、主要参考文献
.
33
张维迎著,《博弈论与信息经济学》,上海三联书店、 上海人民出版社,1996年版。
Roger B. Myerson著:Game Theory(原文版、译文 版),中国经济出版社,2001年版。
是关于动态博弈进行过程之中面临决策 或者行动的参与人对于博弈进行迄今的 历史是否清楚的一种刻划。
如果在博弈进行过程中的每一时刻,面 临决策或者行动的参与人,对于博弈进 行到这个时刻为止所有参与人曾经采取 的决策或者行动完全清楚,则称为完美 信息博弈;否则位不完美信息。
.
30
零和博弈与非零和博弈
了解自己行动的限制和约束,然后以精心策划的方式 选择自己的行为,按照自己的标准做到最好。 • 博弈论对理性的行为又从新的角度赋予其新的含义— —与其他同样具有理性的决策者进行相互作用。 • 博弈论是关于相互作用情况下的理性行为的科学。
.
4
如何在博弈中获胜?
…… 真的能在博弈中(总是)获 胜吗?
对手和你一样聪明! 许多博弈相当复杂,博弈论并不
施锡铨编著,《博弈论》上海财大出版社,2000年版。
谢识予编著,《经济博弈论》,复旦大学出版社, 2002年版。
谢识予主编,《经济博弈论习题指南》,复旦大学出 版社,2003年版。
博弈论知识点总结推荐文档

博弈论知识总结博弈论概述:1、博弈论概念:博弈论:就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。
博弈论研究的假设:1、决策主体是理性的,最大化自己的收益。
2、完全理性是共同知识3、每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念与预期2、和博弈有关的变量:博弈参与人:博弈中选择行动以最大化自己受益的决策主体。
行动:参与人的决策选择战略:参与人的行动规则,即事件与决策主体行动之间的映射,也是参与人行动的规则。
信息:参与人在博弈中的知识,尤其是其他决策主体的战略、收益、类型(不完全信息) 等的信息。
完全信息:每个参与人对其他参与人的支付函数有准确的了解;完美信息:在博弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动,否则为不完美信息。
不完全信息:参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信息,即存在着有关其他参与人的不确定性因素。
支付:决策主体在博弈中的收益。
在博弈中支付是所有决策主题所选择的行动的函数。
从经济学的角度讲,博弈是决策主体之间的相互作用,因此和传统个人决策存在着区别:3、博弈论与传统决策的区别:1、传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下,最大化自己效用,研究工具是无差异曲线。
可表示为:maxU(Pi),其中P为市场价格,I为消费者可支配收入。
2、其他消费者对个人的综合影响表示为一个参数——市场价格,所以在市场价格既定下,消费者效用只依赖于自己的收入和偏好,不用考虑其他消费者的影响。
但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。
4、博弈的表示形式:战略式博弈和扩展式博弈战略式博弈:是博弈问题的一种规范性描述,有时亦称标准式博弈。
战略式博弈是一种假设每个参与人仅选择一次行动或战略,并且参与人同时进行选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。
《经济学博弈》PPT课件

• 假设n个人参与博弈,给定其他博弈方策略的
条件下,每个博弈方选择自己的最优策略.纳
什均衡指的是"由所有博弈方的最优策略组成
的一个组合"
• n个人制订了一个协议,这n个人是否能自愿遵
守?他们会自觉遵守,这个协议就构成一个纳
什均衡.
• 如果一个协议不构成纳什均衡,它就不可能自
动实施,而需要外力胁迫,这就是无所谓的"协
通过单独改变自己的策略而增加盈利,如能,则
从所分析的策略组合对应的盈利数组引一箭
头,到改变策略后策略组合对应的盈利数组,最
后综合对每个策略组合的分析情况,只有指向、
无指离的策略组合形成对博弈的结果.
2024/2/20
26
具体方法——考察在每个策略组合处各
个博弈方能否通过单独改变自己的策略
而增加得益.如能,则从所分析的策略组合
基本思想——博弈方先找出自己针
对其他博弈方每种策略或策略组合的
最佳对策,即自己的可选策略中与其
他博弈方的策略或策略组合配合,给
自己带来最大得益的策略,然后在此
基础上,通过对其他博弈方策略选择
的判断,包括对其他博弈方对自己策
略判断的判断等,预测博弈的可能结
2024/2/20
14
• 具体方法——对其他博弈方的任一策略组合,
当双方的相对优势策略确定后,哪个格子里面两个
数字都被被划线,那么这个格中所对应的相对
优势策略组合就是一个纳什均衡.
2024/2/20
17
例2、囚徒困境博弈
乙
招
不招
-8,-8
-15,0
0,-15
招
甲
-1,-1
不招
宏观经济学第10章博弈论精品PPT课件

第一节 博弈论概述
一、经济学与博弈论
研究
中心理论
▪ 价格理论
基本假设前提
1. 完全理性 2. 完全信息
主流经济学假设行为 决策人是完全理性的, 且具有与最优化相关 的所有信息,并能正 确地运用这些信息来 指导自己的行理论动。 在该假定下,经济学 家们不顾现实世界的 纷繁复杂,致力于对 均衡和本质规律的研 究。
➢ 完全理性与有限理性
人的完全理性意味着,人有足够的信息、知识和计 算能力,来确保实现自己的效用最大化。因此,理 性假定意味着理性人能够运用数学工具描述人的 (最大化)行为。
对完全理性人的理解
他们有一个很好定义的偏好,并能够按照即定的 偏好进行选择;
他们的选择受到预算约束;
他们努力在约束条件下实现效用最大化。
行动顺序 信息
静态
动态
完全信息
完全信息静态博弈 纳什均衡
完全信息动态博弈 子博弈精炼纳什均衡
不完全信 不完全信息静态博弈 不完全信息动态博弈
息
贝叶斯纳什均衡 精炼贝叶斯纳什均衡
第二节 完全信息静态博弈
一、博弈的基本要素
❖ 一个博弈的基本要素包括参与人或游戏者、 行动、信息、战略、收益或支付、结果、均 衡。
他们即使能够预测和做出计划的话,也没有一种 人类语言能足够丰富和准确地描述它。
完全信息
意味着信息是对称的,充分的,完全信息的人有 足够的信息实现自己最大化行为。
但现实的市场并不完全,如买卖双方的人数并不 足够的多,信息也是不完备的。
有限的人数意味着人们之间的行为是有直接 影响的,所以一个人在决策时必须考虑对方的 反应,而别人的选择也会影响自己的选择 。 现实生活中信息并不总是完备的,这使得价 格机制并不总是实现合作和解决冲突的最有效 安排。
经济博弈论ppt课件

1.3.2博弈论的基本概念
• 例三:市场进入阻扰博弈在位者
默许
高成本的情况
进入者
进入
不进入
40,50
-10,0
0,300
0,300
在位者
默许
阻止
低成本的情况
进入者
阻止
开发
不开发
30,100
-10,0
0,400
0,400
1.4 博弈论的分类
1.4.1博弈方的数量
1.4.2博弈中的策略
• 例一古诺寡头竞争模型
设一市场有1,2厂商生产同样的产品。如果厂
商1的产量为q1 ,厂商2的产量为q2,则市场总
一只鹦鹉训练成一个经济学家,因为它只需要学习两
个词:供给和需求。
• 博弈论专家坎多瑞引申说:要成为现代经济学家,这
只鹦鹉必须再多学一个词,就是“纳什均衡”。
• 张维迎认为:“近几十年来,经济学一直在为其他学
科提供武器,但恐怕没有任何其他工具比博弈论更有
力了”。
1.3博弈论的基本概念
• 1.3.1 博弈论的定义
• 例:囚徒困境
囚徒 2
坦 白
不坦白
坦 白
-5, -5
0, -8
不坦白
-8, 0
-1, -1
两个罪犯的得益矩阵
1.3.2博弈论的基本概念
• 参与人(player):一个博弈中的决策主体,
他的目的是通过选择策略以最大化自己的支付
(效用水平)。参与人可能是自然人,也可能
是团体,如企业、国家甚至可能是若干个国家
卡尼曼(Kahneman)
• 2005:冲突和合作:罗伯特·奥曼(Robert
J.Aumann)和托马斯·谢林(Thomas C.Schelling
博弈论课件

脚的看牌人、看棋人,企业的顾问等。
对参与人的决策来说,最重要的是
必须有可供选择的行动集(策略集)和
一个很好定义 的支付函数。
自然被当作虚拟参与人。
清华诚志
10
(2)策略(strategies ):博弈中有两种策略
概念,一种为纯策略(pure strategy ), 简称策略, 指参与人在博弈中可以选择采用的行动(actions or moves)方案,是参与人在给定信息结构的情况 下的行动规则,它规定参与人在什么时候的什么情
囚徒困境反映了个人理性和集体理性的矛盾。如果 A和B都选择抵赖,各判刑1年,显然比都选择坦 白各判刑8年好得多。当然,A和B可以在被警察 抓到之前订立一个"攻守同盟",但是这可能不会有 用,因为它不构成纳什均衡,没有人有积极性遵守 这个协定,显然最好的策略是双方都抵赖.
清华诚志
5
囚徒困境的意义
“囚徒的两难选择”有着广泛而深刻的意义。 个人理性与集体理性的冲突,各人追求利己 行为而导致的最终结局是一个“纳什均衡”, 也是对所有人都不利的结局。他们两人都是 在坦白与抵赖策略上首先想到自己,这样他 们必然要服长的刑期。只有当他们都首先替 对方着想时,或者相互合谋(串供)时,才可 以得到最短时间的监禁的结果。
清华诚志
26
我们从博弈中学习什么
博弈论告诉人们,要学会理解他人都有自己的思想, 每个个体都是理性的,所以必须了解竞争对手的思 想。商业关系被认为是一种相互作用。但博弈论并 不是疗法,并不是处方,它并不告诉你该付多少钱 买东西,这是计算机或者字典的任务。博弈论只是 提供一些关系的例证,一些有用的解决问题的方法。 这种思维方法也许是企业家应该学习的。对于经济 学家,也许需要学习它的理论模型,它的实验方式 。
微观经济学第九章 博弈论

三、讨价还价策略
讨价还价问题描述 1982年,马克· 鲁宾斯坦(Mark Rubinstein) 用完全信息动态博弈的方法,对基本的、无 限期的完全信息讨价还价过程进行了模拟, 并据此建立了完全信息轮流出价讨价还价模 型,也称为鲁宾斯坦模型。 鲁宾斯坦把讨价还价过程视为合作博弈的过 程,他以两个参与人分割一块蛋糕为例,使 这一过程模型化。
纳什讨价还价解
纳什讨价还价解(Nash bargaining solution) 是约翰·纳纳什(John Nash)在他的关于计 价还价理论(bargaining theory)的两篇文章 (1950v,1953)中提出来的约翰·纳纳什 (John Nash)的工作推动了现代讨价还价 理论的发展。
二、价格大战
家电行业经常会开展各种各样的价格大战, 如彩电价格大战、冰箱价格大战、空调价格 大战、洗衣机价格大战等,这些大战的受益 者首先是消费者。厂家价格大战的结局是一 个“纳什均衡”,博弈的结果对消费者是有 利的,对厂商是不利的。价格大战的结果是 导致厂商的利润受损。如果不采取价格大战 ,企业可以采取正常价格策略,或者联合起 来采取高价格策略,都比价格战的利润高。
在这个模型里,两个参与人分割一块蛋糕, 参与人1先出价,参与人2可以选择接受或 拒绝。如果参与人2接受,则博弈结束,蛋 糕按参与人的方案分配;如果参与人2拒绝, 他将还价,参与人1可以接受或拒绝;如果 参与人1接受,博弈结束,蛋糕按参与人2 的方案分配;如果参与人1拒绝,他再出价; 如此一直下去,直到一个参与人的出价被 另一个参与人接受为止。因此,这属于一 个无限期完美信息博弈,参与人1在时期1, 3,5,⋯ 出价,参与人2在时期2,4,6, ⋯ 出价。
纳什均衡:在一个纳什均衡里,任何一个参 与者都不会改变自己的策略,如果其他参与 者不改变策略。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
市场进入阻挠博弈树
(3)、概念:一个纳什均衡称为精炼纳什均衡,当且只当参 与人的战略在每一个子博弈中都构成纳什均衡,即组成精炼纳 什均衡的战略必须在每一个博弈中都是最优的。因此,(进入, 斗争)不是一个精炼纳什均衡,而(进入,合作)是惟一的子 博弈精炼纳什均衡。
* “ 不可置信——承诺行动”的例子: 谈恋爱;
(2 )扩展性博弈形式的5个要素:参与人;每个参与人选择
行动的时点;每个参与人在每次行动时可供选择的行动集合;每 个参与人在每次行动时有关对手过去行动选择的信息;支付函数。
博弈树——是扩展型的一种形象化表述。 “子博弈”
(40,50) 在位者 合作
进入 进入者
不进入
斗争 (-10,0)
(0,300)
9,-1
0,0
搜集 大股东
等待
小股东
搜集
等待
5,1
4,4
9,-1
0,0
研发 大企业
等待
小企业
研发
等待
5,1
4,4
9,-1
0,0
3、性别战:
女 足球
芭蕾
男
足球 2,1
0,0
芭蕾 0,0
1,2
先动优势:若男的买票,两人就会出现在足球场;若女的买 票,两人就会出现在芭蕾舞厅;
4、斗鸡博弈: 进
A 退
(3)纳什均衡允许了不可置信威胁的存在。在市场进入的例 子中,如果在位者摆出一幅“你进入我就斗争”的架式,(不 进入,斗争)便成为一个纳什均衡。
在位者
默许
斗争
进入 进入者
40,50
不进入 0,300
-10,0 0,300
2、泽尔腾的贡献
(1)针对静态纳什均衡的问题,泽尔腾对动态博弈进行了分析, 定义了子博弈精炼纳什均衡。将纳什均衡中不可置信威胁战略剔 除出去,使均衡战略不再包含不可置信的威胁。它要求参与人的 决策在任何时点上都是最优的。决策者要“应变”,而不是 “固守”。
夫妻博弈: 吵
丈夫 躲
B
进
退
-3,-3
2,0
0,2
0,0
妻子
吵
躲
-3,-3
2,0
0,2
0,0
5、市场进入阻挠 进入
进入者 不进入
在位者
默许
斗争
40,50 0,300
-10,0 0,300
寻找纳什均衡:
2
L
M
R
U 0,4
4,0
5,3
1 M 4,0
0,4
5,3
D 3,5
3,5
6,6.
重复优势解法:逐次删去劣势策略。
2
L
M
R
1
U 2,3
0,2
3,4
D 1,1 2,7. 4,5
2
L
M
R
U 4,3.
5,1
6,2
1 M 2,1
8,4
3,6
D 3,0
9,6
2,8
(二)、完全信息动态博弈:子博弈精炼纳什均衡
1、纳什均衡存在的问题:
(1)一个博弈可能有不止一个纳什均衡,哪一个会发生并不 知道;
(2)静态博弈时,不考虑自己的策略对对手的影响,动态博 弈中必须进行考虑。
博弈论专题
一、基本概念 1、参与人;2、行动;3、信息;4、战略;5、支付函数 6、结果;7、均衡; 二、分类 1、静态博弈:参与人同时参与选择行动。
2、动态博弈:参与人的行动有先后顺序,且后行动者能够观 察到先行动者所选择的行动。 3、完全信息:每一个参与人 对所有其他参与人(对手)的特 征、战略空间及支付函数有准确的知识。 4、不完全信息:每一个参与人 对所有其他参与人(对手)的 特征、战略空间及支付函数没有准确的知识。
沙滩买冰淇淋的两商贩博弈均衡
纳什均衡: 1、如果A的选择是给定的,则B的选择是最优的;如果B的 选择是给定的,则A的选择是最优的;这样策略组合的均衡为 纳什均衡; 2、它是这样一种战略组合,这种战略组合由所有参与人的最 优战略组成,即给定别人战略的情况下,没有任何单个参与人 有积极性选择其他战略,从而没有任何人有积极性打破这种均 衡,即僵局。
降价 厂商A
不降价
-8,-8 -10,0
0,-10 -1,-1
国家军备竞赛策略均衡 国家B
竞赛
不竞赛
竞赛 国家A
不竞赛
-8,-8 -10,0
0,-10 -1,-1
夫妻竞赛策略均衡
丈夫
吵架
不吵架
妻子
吵架
不吵架
-8,-8 -10,0
0,-10 -1,-1
2、智猪博弈:
大猪
按 等待
小猪
按
等待
5,1
4,4
占优策略均衡:
由 博弈中的所有参与者的占优策略组合所构成的就是占 优策略均衡。
合作 甲
不合作
乙
合作
不合作
10,10 6,12
12,6
8,8
占优策略均衡
(一)、纳什均衡 经典例子: 1、囚徒困境:
坦白 囚徒A
抵赖
囚徒B
坦白
抵赖
-8,-8 -10,0
0,-10 -1,-1
厂商价格策略均衡
厂商B
降价
不降价
博弈的分类及对应的均衡概念Leabharlann 行动顺序 信息静态
动态
完全信息
完全信息静态博 完全信息动态博
弈(纳什均衡)、弈(子博弈精炼
纳什
纳什均衡)、泽
尔腾
不完全信息
不完全信息静态 博弈(贝叶斯纳 什均衡)、海萨 尼
不完全信息动态 博弈(精炼贝叶 斯纳什均衡)、 泽尔腾
所谓博弈均衡指博弈中所有参与者都不想改变自己的策略的这 样一种状态。
设想在位者成本函数有两种可能的情况,对应于这两种情况的 支付矩阵分别如表一和表二:
解释:
在给定进入者选择进入的情况下,高成本在位者的最优战略是 默许,而低成本在位者的最有战略是斗争。
低成本情况下斗争之所以比默许优,可能是由于在位者的生产 成本是如此低,从而他在非常低的价格下获得的垄断利润也高 于相对高的价格下分享到的寡头利润;也可能在位者有一种好 斗的天性,他更乐于与进入者斗争而不是合作。
破釜沉舟;
红军、白军抢占小岛,炸桥断后路;
严 老师
不严
学生 努力
不努力
80,80. 60,90
70,59 59,70
承诺行动:严!!!
(三)不完全信息静态博弈:贝叶斯纳什均衡
市场进入的例子——进入者知道在位者的偏好、战略空间及各 种战略组合下的利润水平。如果进入者实际上并不完全了解在 位者的生产函数、成本函数及偏好,这就是不完全信息博弈。
自然首先行动——选择参与人的类型,被选择的参与人知道自 己的真是类型,而其他参与人并不清楚这个被选择的参与人的 真是类型,仅知道各种可能类型的概率分布。
表一:市场进入:高成本情况
在位者
默许
斗争
进入 进入者
40,50
不进入 0,300
-10,0 0,300
表一:市场进入:低成本情况
在位者
默许
斗争
进入 进入者
30,100
-10,140
不进入 0,400 0,400
在1967年以前,遇到这种不知对手的选择情况,自己的战略自 然无法选择,因此相应的问题无法解决。海萨尼的贡献在于引 进了一个虚拟的参与人—“自然”,使得上述情况可以分析。