博弈论复旦大学中国经济研究中心
博弈论讲义完整版

同样的情形发生在: 公共产品的供给 美苏军备竞赛 经济改革 中小学生减负 ……
第一章 导论-囚徒困境
囚徒困境的性质:
个人理性和集体理性的矛盾; 个人的‚最优策略‛使整个‚系统‛处于不利 的状态。
思考:为什么会造成囚徒困境 是否由于‚通讯‛问题造成了囚徒困境? ‚要害‛是否在于‚利己主义‛即‚个人理 性‛?
第一章 导论-囚徒困境
通俗地讲:
纳什均衡的含义是:给定别人战略情况下,没有 任何单个参与人有积性选择其他战略,从而没有人 有积极性打破这种均衡。
第一章 导论-囚徒困境 一只河蚌正张开壳晒太阳,不料,飞来了 一只鸟,张嘴去啄他的肉,河蚌连忙合起两张 壳,紧紧钳住鸟的嘴巴,鸟说:‚今天不下雨, 明天不下雨,就会有死蚌肉。‛河蚌说:‚今 天不放你,明天不放你,就会有死鸟。‛谁也 不肯松口,有一个渔夫看见了,便过来把他们 一起捉走了。
不开发
1000,0 0,0
开发商A
博弈的战略式表述
一 、博弈的基本概念及战略表述
需求小时,售价7千万;
如果市场上只有一栋楼 需求大时,可卖1.8亿 需求小时,可卖1.1亿
一 、博弈的基本概念及战略表述
需求大的情况 开发商A 开发 不开发 需求小的情况 开发 不开发
开发商B 开发 不开发
4000,4000 0,8000 8000,0 0,0
开发商B
开发
-3000,-3000 0,1000
第一章 导论
注意两点: 1、是两个或两个以上参与者之间的对策论 当鲁滨逊遇到了‚星期五‛
石匠的决策与拳击手的决策的区别
第一章 导论
2、理性人假设 理性人是指一个很好定义的偏好,在面临定的约束条 件下最大化自己的偏好。 博弈论说起来有些绕嘴,但理解起来很好理解, 那就是每个对弈者在决定采取哪种行动时,不但要根 据自身的利益的利益和目的行事,而且要考虑到他的 决策行为对其他人可能的影响,通过选择最佳行动计 划,来寻求收益或效用的最大化。
复旦大学经济博弈论课件--经济博弈论242页PPT

30.11.2019
课件
3
2.1.1 上策均衡
上策:不管其它博弈方选择什么策略,一博弈方 的某个策略给他带来的得益始终高于其它的策 略,至少不低于其他策略的策略
囚徒的困境中的“坦白”;双寡头削价中“低 价”。
上策均衡:一个博弈的某个策略组合中的所有策 略都是各个博弈方各自的上策,必然是该博弈 比较稳定的结果
课件
17
竞争:个体利益最大化
q1R 1(q2,q3)4 81 2q21 2q3
11 q2R 2(q 1,q3)4 82q 12q3 q 3R 3(q 1,q2)4 81 2q 11 2q2
q1 *q2 *q3 *24 u1*u2 *u3 *576
Q*72
u*1728
21
二、混合策略、混合策略博弈 和混合策略纳什均衡
混合策略:在博弈G {S1, Sn;u1, un中},博弈方 i的策略
空间为 Si {si1, sik},则博弈方 i以概率分布 pi (pi1, pik)
随机在其 k个可选策略中选择的“策略”,称为一个“混合策
略”,0其p中ij 1 j1, 对,k
u 1 u 1 ( P 1 ,P 2 ) P 1 q 1 c 1 q 1 ( P 1 c 1 ) q 1 (P 1 c 1 )a 1 ( b 1 P 1 d 1 P 2 )
u 2 u 2 ( P 1 ,P 2 ) P 2 q 2 c 2 q 2 ( P 2 c 2 ) q 2 (P 2 c 2 )a 2 ( b 2 P 2 d 2 P 1 )
上策均衡不是普遍存在的
30.11.2019
课件
4
2.1.2 严格下策反复消去法
严格下策:不管其它博弈方的策略如何变化, 给一个博弈方带来的收益总是比另一种策略 给他带来的收益小的策略
复旦大学微观经济学教师手册*12 博弈论

第12章博弈论一、本章要点概念(注:*表示在原教材中没有讲述的概念,但将在补充内容中加以介绍)零和博弈;常和博弈;变和博弈;纳什均衡;混合策略纳什均衡;纯策略纳什均衡;弱占优策略;占优策略;囚犯困境;重复博弈;协调博弈;聚点均衡;信任博弈;共存博弈;进化稳定策略;序贯博弈*占优均衡分析;*重复剔除严格劣战略;*划线法;*箭头法;*逆推法原理(注:序号m.n,m代表第几节,n代表原理的序号)1.1 博弈论是一种分析行为人之间策略互动的有用工具。
根据博弈参与人总收益是否变化,博弈可以分为常和博弈与变和博弈。
前者充分体现了参与人之间的竞争或冲突,后者则帮助我们思考如何能够实现社会最优的有效率结果。
1.2 纳什均衡是指这样一组策略,给定其他人的选择,每个参与人的选择对自己而言都是最优的。
纳什均衡是策略的均衡,它是在人们的策略互动中实现的。
2.1囚犯困境中存在个人理性与集体理性冲突,因而社会最优的结果无法实现;协调博弈与信任博弈中,个人理性与集体理性并不冲突,但个人理性需要借助某种机制才能实现社会最优的结果。
2.2 与纳什均衡相比,占优均衡更为严格,占优均衡一定是纳什均衡,但反之则不一定。
2.3重复博弈中的合作需要以始终存在着将来进一步合作的可能为条件。
通过在无限次的重复博弈中建立声誉,囚犯困境中合作的结果就能够实现。
3.1通过将参与人的不同选择理解成坚持各自不同选择的不同类型的参与人,博弈论就能够被用于分析动物世界中的演化问题。
动物种群的演化,可以理解为采取某种(或某些)特定策略的动物逐步淘汰了采取其它非最优策略的同伴。
4.1 在动态博弈中,威胁或承诺将变得可能。
与静态博弈相比,这很可能会改变博弈的结果,使社会最优得以实现。
二、新增习题1、石头剪刀布的游戏是以下那种博弈?(可多选)A. 零和博弈B. 静态博弈C. 变和博弈D. 动态博弈2、以下说法正确的是什么?(可多选)A. 占优博弈一定是纳什博弈B. 占优博弈不一定是纳什博弈C. 纳什博弈一定是占优博弈D. 纳什博弈不一定是占优博弈3、甲乙 AB以上博弈的均衡是什么?A. B,XB. A,Y和B,XC. A,YD. 不存在4、两家公司甲和乙都希望发展一项新技术,考虑市场风险,技术的兼容性很重要。
博弈论最全完整ppt-讲解

例1:无谓竞争(The GPA Rat Race)
你所注册的一门课程按照比例来给分:无论 卷面分数是多少,只有40%的人能够得优秀, 40%的人能得良好。
所有学生达成一个协议,大家都不要太用功, 如何?想法不错,但无法实施!稍加努力即可 胜过他人,诱惑大矣。
问题是,大家都这么做。这样一来,所有人 的成绩都不比大家遵守协议来得高。而且, 大家还付出了更多的功夫。
约翰·纳什 1928年生于美国
莱因哈 德·泽尔 腾, 1930 年生于 德国
约翰· 海萨尼 1920年 生于美 国
1996年诺贝尔经济学奖获得者
英国人詹姆斯·莫里斯 (James A. Mirrlees)和美国人威廉-维克瑞 (William Vickrey)
获奖理由:前者在信息经济学理论领域做 出了重大贡献,尤其是不对称信息条件 下的经济激励理论的论述;后者在信息 经济学、激励理论、博弈论等方面都做 出了重大贡献。
博弈论为众多学科提供了分析的概念和方 法:经济学和商学,政治科学,生物学, 心 理学和哲学。
如何在“博弈”中获胜?
日常生活中的博弈(“游戏”)往往指的是 诸如赌博和运动这样的东西: 赌抛硬币 百米赛跑 打网球/橄榄球
How can you win such games? 许多博弈都包含着运气、技术和策略。 策略是为了获胜所需要的一种智力的技巧。
没有某个这样的暗示,默契的合作就完 全不可能。
例3:为什么教授如此苛刻?
许多教授强硬地规定,不进行补考,不 允许迟交作业或论文。
教授们为何如此苛刻? 如果允许某种迟交,而且教授又不能辨
别真伪,那么学生就总是会迟交。 期限本身就毫无意义了。 避免这一“滑梯”通常只有一种办法,
独家 王勇:在复旦经院读本科那些年遇到的“学术型”校友

独家王勇:在复旦经院读本科那些年遇到的“学术型”校友导读王勇博士现为香港科技大学助理教授。
他于2000年在复旦大学获经济学(国际经济学)学士学位,2003年在北京大学中国经济研究中心(CCER)获经济学硕士学位,2009年在芝加哥大学获经济学博士学位。
本文为王勇博士授权本站独家发布,如需转载,请联系授权。
在复旦读96级本科时,我虽然是世界经济系的学生,却在经济系正式修过好几门课,包括当时还是研究生的陆铭教的劳动经济学、袁志刚老师的中级宏观与中级微观(那年张军老师没有教中级微观)、石磊老师的产业组织理论;旁听了一学期经济学院博士生的专题课(蒋学模、洪文达、张军等轮流授课)。
我们那届世经系最好的课程当然是刚从澳洲回来的韦森老师的比较经济学!那时我大三,上完了韦森老师一学期的课以后,耳濡目染,让我突然觉得当经济学家非常有意思。
精品课程还有华民老师的国际经济学与公共经济学、谢识予老师的博弈论;尹翔硕老师的国际贸易概论也很不错,等等。
大三下学期,我的经济学启蒙恩师韦森告诉我北大有个叫CCER的地方。
因为我在两个系都上过课的缘故,所以给我写直升CCER推荐信的四位老师除了世经系韦森老师和谢识予老师(国际经济专业导师)之外,还有经济系的张军老师与袁志刚老师。
而与我互动比较多的“学术型”学生更多的却都是经济系的。
大四时我自学刚被翻译成中文的David Romer的《高级宏观经济学》(后来发现翻译者苏剑竟变成我在北大CCER的师兄),该书前三章都是经济增长,自己一下子就被吸引住了,直到现在仍不能自拔。
我学里面的动态优化相位图,还写了一个小模型,遂被陆铭引介给经济系的另外一位研究生宋铮,于是在复旦南区宿舍我第一次见到了宋铮及其室友赵扬,如今两位师兄都在香港......经济系的陆铭、陈钊当学生时联合创办了一份学术小报,该报成了经济学院本科生学术精神的传承体。
由该报我结识了同级经济系的张吉鹏、低两级的经济系师妹吴桂英、以及卢杨...... 记得再后面的经济系的钟宁桦、王伟等人也当过该小报的主编,后来也都成了我北大CCER的师弟,还有徐轶青。
博弈论复旦大学中国经济研究中心--资料

are a NE, if for each player i,
si* is (at least tied for) player i’s best response to the strategies
specified for the n-1 other players,
( s1* , ...,
s* i 1
Proposition A In the n -player normal form game
G {S1,..., Sn ; u1,..., un}
if iterated elimination of strictly dominated strategies
eliminates all but the strategies (s1*,..., sn* ) , then these
Cont’d
Firm A’s problem:
A PqA cqA (a qA qB )qA cqA
dA dqA
a 2qA
qB
c
0
qA
a
qB 2
c
d 2 A 2 0
dq
2 A
Cont’d
By symmetry, firm B’s problem. Figure Illustration: Response Function, Tatonnement Process Exercise: what will happens if there are n identical Cournot
,
si* ,
s* i 1
,
...,
sn*
)
ui
复旦大学经济博弈论课件--经济博弈论536页

d d x tx ( u y u ) x (x x 2 ) x 2 ( 1 x ) x 2 x 3
22.03.2020
课件
14
动态微分方程的相位图
dx/dt 0
0.5
1
x
稳定状态、不动点:x*=0, x*=1
22.03.2020
其中abcd可以是任何得益,根据问题设定。
22.03.2020
课件
17
复制动态分析
复制动态的进化规 则是生物学中生物 特征进化规则 设x为采用策略1的 比例
dx/dt
u1 x a (1 x) b u2 x c (1 x) d u x u1 (1 x) u2
d d x tx(u 1 u )x[u 1x1u (1x)u 2] x(1x)u (u) x(1x)x[(ac)(1x)b (d)]
复制动态 相位图
22.03.2020
x 课件
1
x
18
5.3.3 协调博弈的复制动态 和进化稳定博弈
博弈方2 策略1 策略2 策略1 50,50 49,0 策略2 0,49 60,60 一般2*2对称博弈
dx/dt
11/16
d x F (x ) x (1 x )x [ (a c ) (1 x )b ( d )] dt
22.03.2020
课件
3
5.1.2 有限理性博弈分析框架
最优反应动态:有快速学习能力的小群体成员的 反复博弈
复制动态:学习速度很慢的成员组成的大群0
课件
4
5.2 最优反应动态
5.2.1 协调博弈的有限博弈方 快速学习模型
《复旦大学--经济博弈论》-公开课件

n 克劳鳆和索贝尔采用的一种随机选择的混合策 略可以克服这种问题。
1/26/2020
复旦大学经济博弈论课件
部分合并完美贝叶斯均衡的区间划分和数量
n两区间部分合并均衡区间长度不等长, =0.5-2b,前一 个区间的长度是 -0 = 0.5-2b,后一个区间的长度为1- = 0.5+2b,后一个区间长4b。 n结论对更多区间的部分合并均衡也成立。n区间,[ , ) 是之一,长度为c,行为方对该区间类型最优行为( + )/2 ,对后一区间[ , )类型的最佳行为( + )/2。两个区间 交界处类型声明方偏好的行为,须在( + )/2和( + )/2 间无差异:
1/26/2020
复旦大学经济博弈论课件
8.1.1 不完全信息动态博弈问题
n 古玩市场等各种议价博弈 n 不完全信息先后选择产量的寡头市场产量博弈 n 彩礼问题 n 广告对消费者的影响 n 学历、成绩在招聘人才、员工中的作用 n 投保人寿保险前的体检 n 学生考试前和毕业论文中的诚信承诺
1/26/2020
声明方 类型
2,0 1,1 1,1 2,0
不能传递信息(声明方 与行为方偏好相反)
1/26/2020
1. 不同类型的声明方必须偏好行为方不同行为 2. 对应声明方不同类型行为方必须偏好不同行为 3. 行为方的偏好必须与声明方具有一致性
复旦大学经济博弈论课件
离散型声明博弈模型
1/26/2020
复旦大学经济博弈论课件
第八章 不完全信息动态博弈
本章讨论不完全信息动态博弈,也就是动 态贝叶斯博弈。动态贝叶斯博弈与静态贝叶斯 博弈在许多方面是相似的,差别只是动态贝叶 斯博弈转化成的不是两阶段有同时选择的特殊 不完美信息动态博弈,而是更一般的不完美信 息动态博弈,因此可以直接利用不完美信息动 态博弈的均衡概念进行分析。本章主要介绍信 息传递条件、机制和效率方面的模型。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.Static Game of Complete Information
1.3 Further Discussion on Nash Equilibrium (NE) 1.3.1 NE versus Iterated Elimination of Strict
Dominance Strategies
(2) Players 3 and 4 observe the outcome of the first stage
( a 1 , a 2 ) and then simultaneously choose actions and
from feasible sets A 3 and A 4 , respectively. (3) Payoffs are ui(a1,a2,a3,a4), i 1,2,3,4
Proposition A In the n -player normal form game
G { S 1,...,S n;u 1,...,u n}
if iterated elimination of strictly dominated strategies
eliminates all but the strategies (s1* , ..., sn* ) , then these
Cont’d
Proposition B In the n -player normal form game
G {S1,...,Sn;u1,...,un}
if the strategies (s1* , ..., sn* ) are a NE, then they survive
iterated elimination of strictly dominated strategies.
a a (1)Players 1 and 2 simultaneously choose actions 1 and 2 from feasible sets A 1 and A 2 respectively.
(2) Payoffs are u i(a 1 ,a 2,a 3 *(a 1 ,a 2),a 4 *(a 1 ,a 2))
;
1
2
i (3) The payoff to firm is given by the profit function
i(qi,qj)qi[P(Q )c]
P(Q)aQis the inverse demand function, Q q1 q2, and
c is the constant marginal cost of production (fixed cost being zero).
FOC:
v (G * * ) G * * v '(G * * ) c 0
(4)
Comparing (3) and (4), we can see that
G*G**
Implications for social and economic systems (Coase Theorem)
2. Dynamic Games of Complete Information
strategies are the unique NE of the game.
A Formal Definition of NE
In the n-player normal form G {S1,...,Sn;u 1,...,un}
the strategies (s1* , ..., sn* )
2.1 Dynamic Games of Complete and Perfect Information
2.1.A Theory: Backward Induction Example: The Trust Game
General features:
a (1) Player 1 chooses an action 1 from the feasible set A 1 . a (2) Player 2 observes 1 and then chooses an action a 2 from
d A dqA
a
2qA
qB
c
0
qA
a
qB 2
c
d 2 A dqA2
2
0
Cont’d
By symmetry, firm B’s problem. Figure Illustration: Response Function, Tatonnement Process Exercise: what will happens if there are n identical Cournot
2.1.B An example: Stackelberg Model of Duopoly
Two firms quantity compete sequentially.
q Timing: (1) Firm 1 chooses a quantity 1
0
;
q q 0 (2) Firm 2 observes and then chooses a quantity
Hardin(1968) : The Tragedy of Commons
Cont’d
There are n farmers in a village. They all graze their goat on the village green. Denote the number of goats the i t h farmer owns
goats to own (to choose g i ).
Cont’d
His payoff is
g iv ( g 1 ... g i 1 g i g i 1 ... g n ) c g i
(1)
In NE (g1*,..., gn*) , for each
i
,
g
* i
must maximize
least one NE, possibly involving mixed strategies.
See Fudenberg and Tirole (1991) for a rigorous proof.
1.4 Applications 1.4.1 Cournot Model
Two firms A and B quantity compete.
Cont’d
A maximum number of goats : Gmax:v(G)0 ,
for G Gmax but v(G) 0 for G Gmax
Also v'(G )0,v''(G )0
The villagers’ problem is simultaneously choosing how manyLeabharlann (1),given
that other farmers choose
(g1*,...,gi*1,gi*1,gn *)
Cont’d
First order condition (FOC):
v (g i g * i) g iv '(g i g * i) c 0 (2)
(where g * i g 1 * ... g i* 1 g i* 1 ... g n * )
are a NE, if for each player i,
s
* i
is (at least tied for) player i’s best response to the strategies
specified for the n-1 other players,
( s 1 * , . . . , s i * 1 , s i * , s i * 1 , . . . , s n * ) u i ( s 1 * , . . . , s i * 1 , s i , s i * 1 , . . . , s n * )
Here the information set is not a singleton.
Consider following games
(1)Players 1 and 2 simultaneously choose actions a 1 and a 2
from feasible sets A 1 and A 2 , respectively.
Cont’d
We solve this game with backward induction
q2argmax2(q1,q2)q2(aq1q2c)
q2 *R2(q1)aq21c
(provided that q1 a c ).
Cont’d
Now, firm 1’s problem
q1argm ax1(q1,R2(q1))q1[aq1R2(q1)c]
by g i , and the total number of goats in the village by Gg1...gn
c Buying and caring each goat cost and value to a farmer of
grazing each goat is v ( G ) .
Summing up all n farmers’ FOC and then dividing by n yields
v(G *)1G *v'(G *)c0 (3) n
Cont’d
In contrast, the social optimum G * * should resolve
m axG v(G )G c
Inverse demand function PaQ,a0
They have the same constant marginal cost, and there is no fixed cost.